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1)  RESEARCH  —  _ 

The  contractors  have  continued  their  e^ort/on  the  design  of  approximate  finite  dimensional 
filters  in  the  case  of  small  observation  noise.  More  precisely,  we  are  concerned  with  the 
problem  :  — - 

dXt  =  f(Xt)  dt  +  g(Xt)  dWt 


dYt  =  h(Xt)  dt  4-  edVt 

Where  £  is  a  ’’small  parameter”,  i.e.  we  want  to  study  the  asymptolics  £ 


0. 


1-  Numerical  evaluation  of  the  "Katzur-Picard  ”  filter 

Suppose  that  X  and  Y  are  one  dimensional,  and  that  h  is  one  to  one.  Bobrovsky-Katzur- 
Schuss  [1]  have  suggested  an  approximate  filter  for  which  Picard  [4]  has  established  rig¬ 
orously  that  the  difference  between  the  approximate  and  the  exact  filter  is  of  order  £  , 
while  the  difference  between  the  true  value  and  any  ’’resaonable”  filter  is  of  the  order  of 

V?. 

Paula  Milheiro  de  Oliveira  has  started  to  transform  the  proposed  algorithm  into  a 
pactical  algorithm  running  on  a  computer.  The  difficulty  is  that  the  filter  is  given  by  a 
stiff  equation,  and  the  stiffness  is  of  the  order  of  l/£  .  As  a  result,  the  stepsize  of  the 
discretization  scheme  has  to  go  to  zero  as  £  tends  to  zero.  And  precisely,  we  want  to  let  e 
tend  to  zero,  since  we  want  to  check  numerically  an  asymptolic  result  for  £  — *  0. 

In  her  ”Dea  report”  [3],  P.  M.  de  Oliveira  compares,  in  the  limit  £  — *  0,  both  the 
Katzur-Picard  filter  and  the  extended  Kalman  filter  to  the  simulated  {X(}  that  has  pro¬ 
duced  the  given  observation.  In  a  current  work,  she  compares  the  two  filters.  Another 
problem  is  to  obtain  the  discretized  version  of  the  Katzur-Picard  filter,  i.e.  to  obtain  the 
equivalent  of  the  Picard  results  for  discrete-time  systems.  In  the  report,  the  continuous 
equation  is  discretized  first  by  a  standard  Euler  method,  an  then  a  modified  scheme  is 
given,  which  gives  a  more  satisfactory  result  for  small  £  and  A t.  No  justification  is  given 
for  this  new  algorithm.  The  good  approach  should  be  to  derive  a  Katzur  -  Picard  type  of 
filter  for  the  discrete  time  filtering  problem  with  small  observation  noise.  This  approach 
is  presently  under  research. 
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2-  The  case  where  h  is  locally  one  to  one 

Let  us  start  with  the  piecewise  linear  problem,  with  g=l,  f  and  h  being  piecewise  linear. 
More  specifically,  let  us  suppose  that  : 

f(x)  =-CLiX  +  6,  x  >  0 

a2x  +  6,  x  <  0 

h(x)  =cix,  x  >  0 

c2x,  x  <  0 

We  are  specifically  interested  in  the  case  where  cic2  <  0.  The  idea  is  that,  provided 
the  conditional  law  has  a  small  variance,  as  in  the  case  where  h  is  one  to  one,  then  the 
conditional  law  should  be  during  most  of  the  time  concentrated  either  on  M+  or  on  jR_ . 
Consequently,  if  we  compute  it  with  functions  h  and  f  which  are  wrong  on  the  other  side 
of  0,  the  error  should  be  small.  Therefore,  if  we  consider  the  two  Kalman  filters  associated 
with 

fi{x)  =  aiz  +  b,  hl(x)  =  cix 

on  one  side,  and 

/2(x)  =  a2x  4-  6,  h2(x)  =  c2x 

on  the  other,  then  one  of  the  two  corresponding  outputs  should  be  close  to  the  optimal 
filter.  It  would  just  remain  to  choose  between  the  two  filters. 

It  turns  out  that  provided  |ci|  ^  |c2|  (or  at  least  ai  ^  02)  the  above  holds,  and  one 
can  choose  between  the  two  filters  on  the  basis  of  a  likelihood  ratio  which  can  be  computed 
from  the  two  Kalman  filters.  Let  us  mention  that  the  variance  of  the  optimal  filter  is  small 
only  when  the  process  {„Xj}  has  been  away  from  zero  for  some  time,  and  that  one  needs 
to  detect  the  times  when  Xt  crosses  zero.  The  case  of  more  than  two  intervals  is  treated 
similarly.  The  analysis  is  developped  in  Fleming,  Ji,  Pardoux  [2],  The  nonlinear  case  with 
piecewise  one-to-one  h  will  be  treated  later  in  another  publication. 


2)  TRANSFER  TO  THE  US 

Fabien  Campillo  has  given  a  talk  on  the  E.  M.  algorithm  at  the  26  th  C.  D.  C.  at  Los 
Angeles  in  december  1987. 
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Le  sujet  de  ce  rapport  se  situe  dans  le  chapitre  plus  vaste  des  probifemes  de  filtrage  non 
linfeaire  de  diffusions  unidimensionnelles  dans  le  cas  d’un  bruit  d’observation  de  petite  covari¬ 
ance,  ce  qu’on  appellera  un  “petti  6ruti  d’observation” . 

Notre  but  est  double.  D’une  part,  on  se  propose  de  comparer,  sur  un  exemple  concret,  les 
rfesultats  obtenus  par  l’application  du  filtre  de  Kalman  fetendu  avec  ceux  obtenus  par  le  filtre 
de  Katsur-Picard.  D’autre  part,  on  veut  verifier  numeriquement  les  resultats  theoriques  de 
J.  PICARD  (cf.  [Picard]),  sur  l’ordre  de  l’fecart  entre  ces  filtres  approchfes  et  le  filtre  optimal 
quand  le  bruit  d’observation  deviant  de  plus  en  plus  petit.  En  fait,  les  comparaisons  presentees 
dans  ce  rapport  n’ont  pas  Hi  etablies  par  rapport  au  filtre  optimal  mais  par  rapport  au  signal 
simul^. 

On  a  rencontre  deux  difficulty  :  la  premiere  est  liee  au  fait  de  qu’il  fallait  trouver  un  schema 
de  discretisation  “convenable”  pour  liquation  du  filtre  de  Katzur-Picard  ;  la  deuxifeme  liee  h 
des  exigences  d'espace  de  mfemoire  et  de  temps  de  calcul  (souvent  rencontree  quand  il  s’agit 
de  simuler  des  problfemes  physiques)  est  de  rfepeter  plusieurs  fois  ces  simulations. 

Dans  le  premier  chapitre  on  introduit  les  outils  mathematiques  necessaires  h  l’fetude  de 
notre  probleme. 

Dans  le  chapitre  2  on  prfesente  le  filtre  de  Katzur-Picard  et  les  rfesultats  asymptotiques  de 
“quality*  des  filtres. 

Enfin,  dans  le  chapitre  3,  on  eonsidfere  un  exemple  concret  et  on  presente  les  resultats 
obtenus. 


mmmmmRmmmmmQimtm  j  mmmmm  >rv  mr 


Table  des  matiferes 


1  Processna  d«  Diffuion  et  Filtrage  Non  Lindaire 

1.1  Processus  de  diffusion  . 

1.1.1  Processus  de  Wiener . 

1.1.2  L ’integrate  stochastique  et  la  formule  de  Ito  .  , 

1.1.3  Equations  differentielles  stochastiques . 

1.2  Filtrage  non  lindaire . 

1.3  Filtrage  non  lindaire  approche . 

1.4  Discretisation  d’une  diffusion . 

1.4.1  Cas  unidimensionnel . 

1.4.2  Cas  multidimensionnel . 

1.5  Un  exemple . . 

2  Le  Ultre  de  Katmr-Picard 

2.1  Presentation  du  filtre . 

2.2  Discretisation  de  liquation  du  filtre  de  Katzur-Picard 

2.2.1  Premiere  methode . 

2.2.2  Deuxieme  methode . 

3  Application 

3.1  Motivation  . 

3.2  L'exemple  concret  . 

3.2.1  Les  result ats  . 

3.2.2  Remarques  . 


1 

1 

1 

1 

4 

4 

7 

9 

9 

11 

12 


i 


17 

17 

18 
18 
18 


t 


20 

20 

20 

22 

32 


< 

i 


:  .  V.  - 


**.  ■ 


I  PROCESSUS  DE  DIFFUSION  ET  FILTRAGE  NON  LINEAIRE  1 

1  Processus  de  Diffusion  et  Filtrage  Non  Lin£aire 

1.1  Processus  de  diffusion 

1.1.1  Processus  de  Wiener 

Soit  (O,  7,  P)  un  espace  de  probability. 

Soient  n  €  IN  et  Q  une  matrice  n  x  n  auto-adjointe  et  semi-definie  positive. 

On  dyfinit  processus  de  Wiener  (n-dimensionnel)  de  matrice  de  covariance  Q  comme  etant  un 
processus  gaussien  {Wt}t€j0,rj  1u>  verifie  : 

i)  W0  =  0. 

ii)  EWt  =  0,  E{WtW',)  =  (s  A  t)Q  ,Vj,J6  [0,T). 

iii)  {Wt}e€|o,r]  est  continu. 

Si  Q  =  I,  le  processus  {We}(€(0,r|  est  appele  processus  de  Wiener  standard  . 

On  peut  dymontrer  que  les  processus  de  Wiener  sont  des  processus  k  acroissements  indy- 
pendants,  i.e. 

VfcelN  V(ft  ,tj,  ■  ■  ■  ,tk)  €  [0,  T\k  (<,<<,<...<<*) 

les  v.  a.  Wtl  -  W0,W«,  -  Wtl , . . . ,  Wtk  -  Wt4_,sont  indypendantes  . 

Considyrons  (O,  7,  7t,  P)  un  espace  de  probability  filtre  (i.e.  (7t)fenl+  est  une  famille 
croissante  de  sous-tribus  de  J  .). 

On  appelle  Tt- P  processus  de  Wiener  de  matrice  de  covariance  Q  un  processus  {W, }teIR+7- 
adapty  (i.e.  tel  que  vtent  +  Wt  est  7t-mesurable)  qui  vyrifie  : 

i)  W0  =  0. 

ii)  VO  <  s  <  t,  W,  -  W,  est  un  vec.  a.  de  loi  M[0,{t  -  s)Q)  indypendant  de  7,. 

iii)  {Wt}(€fi+  est  continu. 

On  le  note  sous  forme  condensee  par  (fl,  7,  7t,  P,  Wt). 

Si  on  considyre,  en  particular,  la  filtration  naturelle  {7,“  }eetR+ ,  ou  7tw  =  cr(W,;0  <  s  <  t)1, 
on  a  alors  que  {Wt}tem+,  processus  de  Wiener  au  sens  de  la  l.‘ire  definition,  peut  etre 
considery  comme  un  7™ -processus  de  Wiener. 

1.1.2  L’intlgrale  stochastique  et  la  formule  de  Ito 

On  considyre  un  espace  de  probability  filtre  (fi,  7,  7t,  P )• 

On  veut  definir  une  integrate  du  type 

f  GdW  =  [  G(s,w)dW(s,w)  , 

Jo  ■'O 

oil  {Wt}t  est  un  7t-processus  de  Wiener. 

On  prysente  la  construction  de  l’integrale  stochastique  dans  le  cas  reel. 

lLes  tribus  conaid^rfces  »ont  supposed  coniplftles  par  Id  P-n^gligeables  dr  J 
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1  PROCESSUS  DE  DIFFUSION  ET  FILTRAGE  NON  LI  Nil  A  IRE 


2 


On  commence  par  d^finir  l’int£grale  d’un  processus  416mentaire  {pt}t<r  (i.e-  un  processus  de 
la  forme  pt( u)  =  p(o/)l[s,T|(t),  oil  9  €  (0,Tj  et  p  est  une  v.  a.  ^j-mesurable  et  born^e)  par  : 

[  pudWu  =p(Wtve  -W0)  ,t  €  [0,T], 
r  o 

Maintenant,  pour  un  processus  en  escalier  <p  G  c  (  7  ),  <pt  =  Pt>  on  d4finit  : 

f  <pudWu±f2  f  p\ldWu 

<=i  ° 

et 

/  <P*dWu=  [  <pudW%-  (  <pudWu,Q  <  s  <T. 

Jq  Jo 


On  a  les  propriety  (pour  <p ,  <p'  €  c)  : 

PI)  E7'  f  <pvdWv  =  0. 

P2)  E7-  f*  <pudW u  f‘  <p'udWu  =  E7-  j\  pu<p'udu  (0  <  s  <  t  <  T). 

P3)  £{supt<r  |  f‘  p.dW. |2}  <  4EJ7  pjdt. 

Le  fait  que  e  est  dense  dans  l’espace  de  Hilbert  M.\t  (0,  T)  ,(3),  permet  de  definir  l’integrale  de 
tout  processus  <p  dans  (0,  T)  : 

Soit  L  le  prolongement  lin4aire  (continu)  de  i’application 

«  —  i2(n,c[o,i)) 

ip  'v.  <f>  =s  {^t}f<r 


On  definit 


/  <PudWu  =  [Lv)t. 

Jo 


Pour  les  processus  dans  L^t(0,T)  ,  (4)  ,  il  faut  considerer  une  suite  croissante  de  temps 
d ’arret  *  : 

rn(w)  =  |  {fo  <PlHdu  >  »}  ■'  Jo  vlMdu  >  n  - 

It  si  /„*  <pl(u)du  <  n 

2e  est  I’e.  v.  des  processus  en  escalier  de  la  forme  : 

Pt  =  ELl  .«*(*)  +  .avec  T,k  -meaurable  et  bornee  V*  ft 

0  =  ta  <  ...  <  t„  =  T. 

*>4^(0,  T)  eat  I'eapace  dea  (claaaea  de)  proreaaua  { } *<7*  qui  v^rifient  : 
i)  <p  :  (t,  ui)  p«(u>)  est  mesurable. 
ii)  Vt  <  T,<pt  est  7\-  mesurable  . 
iii)  E{fJ'pfdt}  <  00. 

4L^(0,T)  est  1'espace  des  processus  ‘iui  v^rifient  i),  ii)  et 

iii’)  J^7*  <p*dt  <  00  p.  s. 

5On  appelle  un  7%-  temps  d'arret  une  v.  a.  r  (a  valeurs  <lans  1R+ )  telle  que  {r  <  f}  £  Jt  . 
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On  pose  <pn  =  ipl (o,r„(-  Alors  f>n  £  ■M/((0,T)  et  on  dSfinit  l’intlgrale  stochastique  par  : 


ft  .  ft  A'. 

/  =  lim  /  ^dW,,  p.i 

Jo  "-“Jo 


Le  processus  {^t}t<r>  —  /q  ,  est  un  processus  continu  et  7t-  adapte  mais  il  n’est 

pas  forc£ment  int^grable.  Par  contre,  l’int^grale  stochastique  d’une  fonction  <p  £  My((0 ,T) 
est  une  7t-  martingale,  i.  e. 

i)  V,e|0-T|  pt  est  7t-  mesurable  et  int^grable. 
i>)  V..t€lo.T],<t,E\<pt\7.)  =  <P,  P-  «■ 

Dans  ce  cas  les  propri£t£s  Pi),  P2)  et  P3)  sont  verifies. 

Cette  definition  d’int^grale  stochastique  peut  etre  etendue  au  cas  vectoriel.  On  consid&re, 
alors,  respectivement  les  espaces  Myt  (0,  T\  IRmx")  et  L\  (0,  T\  ffimxn),  ou  : 

Mf  (0,7’;IRmx*)  est  I’espace  des  (classes  de)  processu:  /^>t}ie|o.ri  a  valeurs  dans 
Kmx"  qui  v6rifient  : 

i)  <p  est  mesurable  et  adapte. 

ii)  El *  Tr(<p,<p't)ds  <  oo 
et 

(0,  T\  IRm*n)  est  Pespace  des  processus  {^}te;n.r  qui  v^rifient  i)  et 
>«’)  lo  Tr[<f>,i(>'t)da  <  oo  p.s. 

On  conaid£re  : 

•  X0  un  vec.  a.  (n-dimensionnel),  70-  mesurable  . 

•  b  une  fonction  de  JR",  mesurable,  7(-  adapte  ,  telle  que  /0  ||6f||df  <  oo  . 

•  <r  €  £><(0,7’;IR,nxn) 

•  (Wt}t  un  7f  processus  de  Wiener  . 

Soit  X  le  processus  (continu  et  adapte)  donn4  par  : 


Xt  —  X®  +  f  b,ds  +•  f  u, dW,. 

Jo  Jo 


On  a  la  formule  de  Ito  : 


*(!,*«)  =  *(0,X0)+  f  *',{s,X,)ds+  f  *'x(s<X.)b,d3+  f  *'x(s,X.)<r,dW, 

Jo  Jo  Jo 

+  1  f  Tr[*“t{s,X,)G,aT,\ds  , 

*  j  0 

pour  tout  0<<<ret<^£  C,,9(|0,  X]  x  JRn),  (a) 
i.e.,  sous  forme  differentielle, 

d*(t,Xt)  =  *!(*,  Xt)dt  +  *',(£,  X,)dXt  +  X-Tr(^7(t,  Xt)<7t<rl )dt 


*CI'a([0,  T\  x  IR”)  cat  I’espacf  des  functions  qui  admcttent  «]es  -l^rivc^s  jusqu’A  1’ordre  1  cn  t  ft 

jusqu'k  1’ordrc  2  cn  x,  continues  en  (t,x). 
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•  Q'z  est  le  vecteur  gradient  . 

•  est  la  matrice  de  d4riv4es  secondes  . 

1.1.3  Equation*  difftrentiellea  stochastiques 
Soient  : 


•  (fl,  7 ,  7t,  P,  Wt)  un  processus  de  Wiener  standard  h  valeurs  dans  IR"  . 

•  X°  un  vec.  a.  a  valeurs  dans  IR'1,  de  carr4  integrable,  To  -  mesurable  et 
ind^pendant  de  {VVt • 

•  les  applications  mesurables 

6:  [0,T|xlRn  — .  IR"  tr  :  [0,  T\  x  IR"  — ►  IRn*m 

[t,x)  ~  fc(t,x)  e  (*,i)  a(f,r) 

verifiant: 

3k  tel  que 

Vt€(o.r|Vi.v€R-  l*(*>r)|2  +  \<r(t,x) |2  <  *2(1  +  |*|2) 

et 

|6(f,i)  -  b{t,y)\  +  |<r(t,x)  -  <r(t,«/)|  <  k\x  -  y\ 
ou  on  note  |6]  =  (£*_,  *>2)^  et  M  =  (TraaT)*  . 

Considerons  liquation  differentielle  stochastique  (EDS)  : 

{  dXt  =  b(t,Xt)dt  +  <r(i,Xt)dWt 

[  x0  =  x°  (1) 

c’est  h  dire  , 

Xt  =  X°+[  b{s,X,)ds+[  u(s,  X,)ds  , 

J  0  J  0 

oil  l’integrale  stochastique  est  prise  au  sens  de  Ito  (si  a(  ,  x)  e  H7Tt  (0,  T;  IR"),  VT  >  0  , 
l’integrale  est  bien  d^finie). 

Sous  les  hypotheses  precedentes  il  existe  un  unique  processus  {-Xt  }tg[o.r|i  a  trajectoires 
continues,  avec  X,  €  (0,  T;  IRn),  VT  >  0,  qui  est  solution  de  l’EDS  (1) 

Un  tel  processus  est  appele  un  processus  de  diffusion.  II  s’agit  d’un  processus  de  Markov 
h  trajectoires  continues  dont  les  probability  de  transition  verifient  certaines  proprietes  (cf. 
[Arnold]  ). 


1.2  Filtrage  non  lin£aire 


Sous  les  hypotheses  du  paragraphe  precedent,  soit  X  le  processus,  a  valeurs  dans  IR" ,  solution 
de  1’EDS  : 


dXt  =  b{t,  Xt)dt  +  e(t,Xt)dWt  , 


oil  W  est  un  processus  de  Wiener  standard  h  valeurs  dans  IR”  . 

En  pratique,  le  problfeme  de  filtrage  non  lineaire  se  presente  de  la  maniere  suivante  : 
On  dispose  d’une  observation  (yt)i>o  telle  que  : 


Vi  —  A(i,  Xt )  +  , 
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oil  vt  eit  un  * bruit  Mane*  et  on  veut  estimer  le  processus  .Y  ,  non  observe,  A  partir  de 
i’infomation  donnee  par  {y,}o<.<t- 

Bien  que  cette  formulation  soit  largement  utilisee  on  preferera  enoncer  le  probleme  de  filtrage 
en  tenant  compte  du  fait  que  l’information  contenue  dans  {y,  ;0  <  s  <  t }  est  equivalents  h 
celle  contenue  dans  { V, ; 0  <  s  <  i},  oil  Yt  =  f‘  y,ds.  Le  “bruit  blanc *  iif  peut  etre  vu  comme 
la  “d£riv6e  d’un  processus  de  Wiener*.  L ’equation  d’observation  peut  alors  s’ecrire  : 

dYt  =  h[t,Xt)dt  +  dWt  ,Yq  =  0  , 

oil  W  est  un  processus  de  Wiener. 

Supposons  que  : 

•  Y  et  W,  sont  des  processus  a  valeurs  dans  IRm  . 

•  la  fonction  h  :  IR+  x  IRn — *  IRm 

(t,  r)  h(t,  x) 

est  mesurable  et  bornee  . 

•  Wt  =  gW t,  oil  W,  est  un  processus  de  Wiener  standard  et  ggT  une  matrice 
m  x  n  definie  positive 

On  supposera  que  les  processus  de  Wiener  W  et  W  sont  independants.  (Le  probleme  peut 
aussi  etre  formule  sans  cette  restriction,  cf.  (Pardouxj). 

/  w  \ 

On  introduit  un  espace  de  probability  filtre  {G,  §,  St,  P)  tel  que  I  —  1  soit  un  P  -  9t 
processus  de  Wiener  standard. 

Les  equations  d’4tat  et  d’observation  s’ecrivent  done  : 


|  dXt  = 
1  dYt  = 


=  b{t,X,)dt  +  o{t,Xt)dWt,  Xq  —  X° 
=  h{t,X')dt  +  gdWt,  Y0=Q. 


Soit  Tt  la  tribu  des  observations  jusqu’a  l’instant  t,  7t  =  <?(Y,\  s  <  i).  Le  probleme  de  filtrage 
consiste  a  calculer  la  loi  conditionnelle  de  Xt  sachant  7t  . 

Cette  loi  conditionnelle  permet  de  calculer  Xt,  l’esperance  conditionnelle  de  Xt  sachant  7t. 
Xt  est.  en  fait,  le  meilleur  estimateur  de  sachant  l’information  7t,  au  sens  du  risque 
quadratique  (i.e.  J5(|Xt  -  Xt|2)  <  fJ(|X<  -  £|2)  v ■  a.  7t  -  mesurable  .)  . 

Aux  hypotheses  precedentes  ajoutons  maintenant  les  suivantes  : 

VT  >  0  , 

•  b  et  a  sont  bornees  sur  [0,T]  x  01”  . 

•  a  est  uniformement  continue  sur  [0,T]  x  01"  . 

•  A  est  mesurable  et  bornee  sur  [0,  T |  x  IR"  . 

•  g  est  mesurable  . 

.  e  L°°([o,r]  x  nin)  vi,j 

Cs  Ij 

oh  a  —  aaT  et  les  d^riv^es  partielles  sont  prises  au  sens  des  distributions  . 

•  3a  >  0  :  V(f,  x)  a(f,r)  >  al  . 


^  /  J*  ^  w.  / 
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Soit  t 

Zt=exp|^  h{s,X.)dY'-^JQ  ,V<e(0,Tj. 

Soit  n  =  C([0,  T\\  IRnxm)  et  St  =  ff(w(fl)  ;0  <  9  <  <),  oil  w(*)  -  ^  j  'j  . 

{Zt}t  est  une  St  -  martingale  d’esp4rance  1  . 

0 

On  peut  definir  une  meaure  de  probability  p  (appel^e  probability  de  ryfyrence)  par  : 

0 

d-~  =  Zrl  (Tfix4) 

oil  P  est  la  probability  aur  (fl,  St)  associee  au  problfeme  (2)  telle  que  la  density  de  la  loi  de 
X0  est  po  €  £a( lR")  . 

O 

Sous  cette  probability  p ,  Jt  est  la  filtration  d’un  processus  de  Wiener.  De  plus  on  a  la  formule 
suivante  : 

E\z,\r,\ 

pour  tout  ip  mesurable  et  bornee  . 

Cette  formule  permet  de  ramener  les  calculs  sur  la  probability  P  aux  calculs  des  memes 

0 

expressions  sur  la  probability  P,  laquelle  a  les  “bonnes  proprietes”  . 

Considerons  l’operateur  aux  derivees  partielles  L  : 

,  v  ,  a2  A  t ,  a 

Lt  =  2 x)d7^J  +  ? b>(t’ x)d7,  ■ 


•j=  i 

L  est  appele  le  gynerateur  infinitesimal  associe  a  1’EDS  (1).  Soit  L *  son  operateur  adjoint. 
L’equation  aux  derivees  partielles  stochastique  (Equation  de  Zakai)  , 

dtp(t,  x )  =  (L "p)(t,  x)dt  +  h(t,  x)p(t,  x)dYt  (3) 

admet  une  solution  7t  -  adaptee 

pe^((n,5r,P);//1)  n  Ia((n,5r,P);C([0,r];£a(IR")))  , 

qui  n’est  autre  que  la  densite  de  la  loi  conditionnelle,  non  normalisee,  de  Xt  sacbant  7t  (cf. 
[Pardoux])  )  : 

f  p(t,x)ip(x)dx  =  E[<p(X,)Zt\7t]  ■ 

J  m* 


On  obtient  done 


SWX.1I/.1  -  J»; 

Im.  P(^x)dx 


■/.- 


q(t,x)<p(x)dx 


oil  q(t,x)  —  t — ^ - X^- —  est  la  densite  conditionnelle  (normalisee)  de  Xt  sachant  7t  ■ 

Jm«P(t,x)dx 
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1.3  Filtrage  non  lin4aire  approch£ 

On  &  vu  que  la  density  conditionnelle  q(t,  i)  est  la  solution  complete  du  problime  de  filtrage, 
i.e.  dans  la  plus  part  des  cas,  on  ne  peut  pas  calculer  X,  =  E\Xt\?t)  sans  calculer  toute  la  loi 
conditionnelle  . 

Dans  le  cas  lin£aire,  les  processus  qui  interviennent  dans  le  SDS  (2)  sont  des  processus 
gaussiens,  les  lois  conditionnelles  q(t,  x)  le  sont  aussi  et  elles  sont  done  caracteris4es  par  la 
moyenne  et  la  covariance.  La  situation  est  diff^rente  dans  le  cas  non  Iin£aire  :  Les  processus  ne 
sont  pas  n£cessairement  gaussiens  et,  en  general,  il  n’existe  pas  un  ensemble  fini  de  param&tres 
qui  caract£risent  ces  density.  L’£volution  de  la  loi  conditionnelle  depend  alors  de  Involution 
d’un  nombre  infini  de  paramitres,  ce  qui  r£presente  une  difficult^  au  niveau  de  la  resolution 
numerique  . 

Soit  Xt  =  E[Xt\Tt] 
et 

Pt  =  E[(Xt  —  Xt)(Xt  -  Xt)\?t]  i  " matrice  de  covariance  de  I’erreur  d’estimation *  . 

Les  equations  devolution  pour  Xt  et  Pt  sont  : 

dxt  =  b(t,xt)dt+(xth(t7x,)T (4) 

d(Pt)i.j  =  [(*A)  -  *,$;]  +  -  6,ATj]  +  (5) 

-  [xTh  -  Ar,A)T  (ggTy'  (hX}  -  kX,)  dt 

+  -  JCXjh  -  X.Xpi  +  2X,X, h)T  ( ggT)~ '  (dYt  -  Adt)  , 

oii'designe  Poperateur  “esperance  conditionnelle”  (  i>(Xt)  =  £[0(Xt)|7(]  ). 

A  la  place  de  ces  equations  on  peut  utiliser  des  equations  approchees,  par  exemple  celles 
du  filtre  de  Kalman  etendu  . 

Le  filtre  de  Kalman  etendu  : 

On  fait  l’hypothese  que  l’estimee  Xt  est  connue  et  peut  done  etre  exploitee  pour  construire 
des  developpements  en  serie  de  Taylor  autours  de  Xt  =  Xt.  On  obtient  ainsi  un  systeme 
lineaire  en  Xt  : 

dXt  =  b(t,xt)  +  -£i(t,x,)(x,  -  xt)  dt  +  <T(t,xt)dwt 

\  dk  /  \  (6) 

dYt  =  \h(t,Xt)  +  —  (f,  *,)(*«- *t)Jdf  +  ?(t,*t)dtft 
II  suffit  maintenant  d’appliquer  le  filtre  de  Kalman  classique  . 


rrtyri" 


.  s 
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On  obtient  les  equations  : 

dX,  =  b(t,  Xt)dt  -t-  K{t)  [y,  -  *(*.  Xt)}  dt 

(  Equation  d’estimation  de  I’etat ) 

—■  =  F(i,Xt)Pt  +  PtFT(t,Xt)-  PtHr(i,Xt)R-l{t)H(t,Xt)Pt 

+  QW 

(  i quation  de  covariance  de  I’erreur) 
K{t)  =  PtHT(t,  Xt)R~'(i)  (  expression  du  gain  ) 


(7) 


R(t)  =  g(t,Xt)gT{t,Xt) 


db 

F{t,Xt)=  —  (t,X«) 
H{t,  Xt)  =  £^{t,Xt) 


x,=x, 


x,  =  x, 


Platons  -  nous  la  situation  oil  les  observations  sont  prises  en  temps  discret  . 

Entre  les  observations ,  Xt  et  Pt  v4rifient  les  4quations  devolution  (4)  et  (5)  avec  R~ 1  =  0, 


dXt  =  b{t,Xt)dt.  Xt._,  =Xk+~l 

dP 

=  F[t,X,)Pt  +  PtFT[t,Xt)  +  Q{t)  ,  Pu_t=P$-'. 


(8) 


Au  moment  oil  on  fait  une  observation  on  obtient  les  equations  d’actualisation  : 

=  xt  +  Kk  [y*  -  (  mise  d  jour  de  I’cstimation  de  I’erreur  ) 

P*  =  [/  -  KkHk\  Pt  (  mise  i  jour  de  la  covariance  de  I’erreur )  (9) 

Kk  =  Pt  H T  [Hk Pt  Hi  +  Rk ]  “  ‘  (  malnce  de  gain  ) 


ou 


x,=x‘ 


Rk  = 


(i*  -  <*-.) 

A'*  et  Pt  sont  les  solutions  de  (8)  prisent  en  t  =  tk. 

Les  equations  (8)  et  (9)  constituent  les  “ equations  du  filtre  de  Kalman  itendu  continu  - 
discret 
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1.4  Discretisation  d’une  diffusion 

Soit  X.  un  processus  Markovien  de  diffusion,  solution  de  l’equation  differentielle  stochastique  : 

dXt  =  b(Xt)dt  +  <j{Xt)dWt  ,  X0  =  X°  .  (10) 

On  veut  simuler,  &  l’aide  d’un  ordinateur,  le  processus  X.. 

On  approche  done  liquation  (10)  par  liquation  discrete  : 

=  /(Jft.;W)  it  =  «^(«  =  o,i,...,iv)  (li) 

selon  une  partition  de  l’intervalle  [0,  Tj. 

Discretisation  et  simulation  de  I’EDS  (10)  : 

Supposons  qu’on  connait  une  realisation  du  processus  de  Wiener,  (tVt(u;)  ;  t  >  0},  et  qu’on 
veut  calculer  une  approximation  de  la  trajectoire  du  signal  {^(u)  ;  t  >  0},  correspondante 
k  cette  realisation. 

Dans  ce  qui  suit  X.  designera  le  processus  simule  qui  approche  le  processus  X.. 

On  a  deja  vu  que,  sous  certaines  hypotheses  (voir  paragraphe  1.1.3  ;  Theortme  d’existence 
et  unicite  )  la  solution  de  (10)  existe  et  est  unique.  II  nous  faut  maintenant  voir  comment 
construire  une  approximation  X.  d’une  telle  solution  . 

On  aimerait  avoir  un  schema  pour  ce  calcul  tel  que  : 

E  —0 

ou  XN  est  le  processus  defini  par  X?  = 

Le  plus  interessant,  * a  priori *,  serait  celui  qui  rend  E  (||Xt  -  X*  ||2)  le  plus  petit  possible, 
i.e.  tel  que  E  (||Xt  -  =  0  (jIj),  avec  p  le  plus  petit  possible. 

Pour  le  cas  particulieroii  tr{Xt)  =  0,  l’equation  (10)  est  une  equation  differentielle  ordinaire 
et  les  schemas  de  calcul  d’une  approximation  de  la  solution  k  chaque  instant  f,  sont  Lien 
connus. 

Dans  le  cas  g4n4ral,  les  schemas  pour  p  =  1  et  p  =  2  qui  suivent  sont  les  plus  utilises.  (Les 
8ch4mas  d’ordre  3  sont  trop  complexes  pour  etre  utilises  en  pratique.) 

1.4.1  Cas  nnidhnensionnel 


.  Le  schema  de  Euler 
D’aprfcs  (10), 


It  =  Xt»  +  f  b(X,)ds  +  f  <7{X,)dW,  . 
*  Jty  Jt 


En  supposant  <r{X,)  ~  o(X{/k)  on  obtient  : 


|  +  Jfb(X») 

\  X»  =  x° 


+  o(X»)&NWk+l 


OU  A  »Wk+i=Wt„+i-Wt  n  est  un  bruit  blanc  gaussien  discret  de  variance 
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Ce  schema  permet  la  construction  d’une  suite  [X^)n^vi  qui  converge  en  moyenne  quadra 
tique  vers  Xt  ,Vt  >  0  et,  etant  b  et  a  uniformement  continues  lipschitziennes,  on  a  : 

£T(|AT^  -  ATt|3)  =  0  (^) 

ce  qui  correspond  h  un  erreur  d’ordre  0  (^==)  dans  l’intlgrale  de  Ito. 
b  .  Le  schema  de  Milsktein  : 

Ce  schema  est  obtenu  en  utilisant  la  formule  de  Ito  sous  forme  integrate  : 

o(X.)  =  <r(XtN)  +  b(Xry{Xr)dT  +  [  o(XT)o'(XT)dWT  +  \  f  o\Xt)o"[Xr)dr. 

‘  h?  h *  2  Jt" 

Si  dans  cette  expression  on  neglige  la  l.‘*re  et  la  3.*>me  integrates  on  obtient  : 

[*  o(X.)dW.  ~  A NWk+lo(X?)+  [  f  o(Xr)o'(Xr)dWrdW, 

Jts  JtS  JtS 

*  ANWk+lo(X?)  +  oo'{ X?)  f  (W,  -  W?)  dW,  , 
ce  qui  correspond  i  approximer  o[X,)  par  : 

*(x£)  +  (w.  -  K)  . 

[/integrate  I  =  /t‘w  (W,  -  Wg)  dW,  peut  etre  calculee  explicitement  de  la  fagon  suivante  : 
d  ( W?  )  =  2 WtdWt  +  dt  (  Formule  de  Ito  ) 

J[w.dw.  =  \[w?-  W^\  -(<-<?) 

I  =  I  [w?  -  wt"7\  -  (t  -  t? )  -  wkN  [Wt  -  Wfcw] 

-  \[Wt  -w?]*  -(*-*")  • 

D’oii  : 

*fcN+1  =  X?  +  ^b(W)  +  ANWkklo(X^)  +  \  [a'XV  -  j\  <T(X?)o'(X?) 

f  X?+l  =  X? +  £b(X£)+o(X?)ANWk+l  +  ±o'{X»)o{X?)(ANWk+l)7 
l  =  X°  ,  oil  b  =  b  -  jtr'er. 

On  a  le  resultat  suivant  (cf.  [Pardoux  -  Talayj  )  : 
ai 

i)  E{X$)  <  oo 

ii)  b  et  o  sont  de  classe  C3 

iii)  b,b',o  et  o'  sont  uniformement  lipschitziennes 
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alora 

la  iuite  (ATjf')fc,  definie  par  le  schema  precedent,  verifie  : 

=  ,VteIN(T), 

ou  {X?  ,t  >  0}  eat  definie  par  X*  =  X^^  et  IN(r)  =  {pT  ;p  €  IN}. 

On  a  done  un  erreur  d’ordre  0  (■£-). 

1.4.2  Caa  mnltidimenaionnel 

On  considere  liquation  : 

n 

dXt  =  b(Xt)dt  +  J2  °AXt)dW't  ,  x0  =  x° 

1=1 

avec  les  memes  hypotheses  pour  Xq,  b  et  a  et  ou  {Wtl , . . .  ,  Wtn  ;  t  >  0}  sont  des  Tt  •  processus 
de  Wiener  standard  mutuellement  independants. 

On  a  le  schema  de  Euler  : 

f  xp+i  =  X"  +  £  b(X?)  +  A"(V^+1) 

l  XQ"  = 

et  le  schema  de  Milshtcin  : 

[  ***+1  =  X?  +  £  W)  +  E"=1  «:(*?)  AW(^+1) 

|  +  £  E-y = ,  <(*?  )°Axn*Nm+l)±"  [wU , ) 

l  *0N  =  x° 

°*  6  =  6  -  1  E”=l  et  =  ((|^) .  J  ' 

Sous  les  memes  hypotheses  de  r^gularite  on  a  encore  : 

£(||*t-*/'||2)  =  <?  (jj 


pour  les  deux  schemas. 

Si  on  impose  certaines  conditions  de  comutativite  on  peut  etablir  un  r^sultat  equivalent  1 
celui  du  paragraphe  1.4.1,  pour  le  cas  multidimensionnel. 


Dana  le  caa  lindaire, 

/  dXt  =  FXtdt  +  GdWt 
\  X«  =  x° 

on  connait  la  solution  explicite  : 


/: 


Xt=exp{Ft}X0+  exp{F(t- s)}GdW, 


(12) 
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Pour  obtenir  la  solution  de  l’6quation  discretisee  11  suffit  de  remarquer  que  : 

X£+l  =  exp{F(t?+1  -  )}**  +  /‘,+  1  exp{F(t?+1  -  '))XgGdW.  , 

Jtk 

i.e.  on  peut  construire  ^approximation  : 

=  *kX?  +  &  , 


<pk  =exp{F(I?+l  -  t")} 
et 

£k  =  fjh+l  exp  -  a)}GdWn  est  un  bruit  blanc  de  variance  Q%  , 

Qk  =  E((k&)  =  /“‘  +  ‘exp{F(<*+1  -s) }<?<?*  exp  {F*(tf+l  -#)}*. 


En  particulier,  en  dimension  1,  on  a  : 

«p{2F(tJ'tl  -  <^)}  -  1 


Qt  =  Q 


2F  *<?(£+.-#), 

pour  A N tk  -  tk+l  -  i*  “petit”. 


et 


X?+l  =  *kx?+£k  a  X?  +F±"tk+tkS  +GANWk+i  , 

ou  ANWk+l  est  un  bruit  blanc  gaussien  de  variance  Q*  . 

Pour  simuler  un  problime  de  filtrage  non  lineaire  il  suffit  de  simuler  le  signal  { X £  }k  comme 
ci-dessus.  Les  observations  sont  obtenues  en  posant  : 

$  =h(tf!,XZ)  +  g{X£)vk 

ou  vk  est  un  bruit  blanc,  vk  ~  A/(0,  £). 


1.5  Un  exemple 

On  considfcre  1 ’exemple  trfcs  simple  d’un  problfcme  de  ballistique  oil  seulement  liquation 
d’observation  est  bruitie.  On  veut  suivre  le  mouvement  d’un  objet  en  chute  libre  h  travers 
l’atmosph^re  et  on  dispose  d’un  radar  dont  la  position  est  illustree  par  les  figures  a  et  b. 
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Fig.  a  Fig.  b 

On  considire  ce  mouvement  modelise  en  dimension  2,  en  supposant  que  l’objet  tombe  en 
ligne  droite  k  une  distance  \Jr\  +  (x  -  r2)2  du  radar,  x  6tant  la  hauteur  de  l’objet  au  dessus 
de  la  surface  terrestre,  k  chaque  instant.  (La  figure  a  est  un  cas  particulier  ou  rt  =  =  0.) 

Les  variables  d’etat  sont  : 

*1  =  X 

Xi  —  x  (  vitesse  ) 

X3  =  P  (  P  est  le  coefficient  ballistique  de  1’objet  ) 

Les  equations  du  mouvement  sont  : 

Z!  ,2  - 

d  -  g  ,  ou  d  -  p- —  et  p  --  p0  exp  -  — 
q  2x3  kp 

et  liquation  d’observation  est  :  ' 

»fc  =  \Jr\  +  (xk  ~  rs)3  +  vk  .  vk  ~  M (0,  r). 

On  a  comme  conditions  initiates  : 

2C(o)  =  a 

'  Pu  0 

Po  =  0  p“,  0 

0  0  Pj3 

Les  matrices  de  d6riv4es  qui  interviennent  dans  les  Equations  du  filtre  de  Kalman  £tendu  sont 

0  1  0 

d  x3  d 
kp  P  x3  X3 

0  0  0 

Les  r4sultats  suivants  on  et6  obtenus  pour  : 
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Po  =  3.4  x  10~3  Ibaec3  /ft*  ,  g  =  32.2  ft/aec3  ,  k„  =  22000  /i 

r  =  100  ft* /Hz 

X(0)  —  J/(10 6  ft,  500  ft3) 

X(0)  -  JV(-6000  ft/aec  ,  2  x  104  ft3 /sec3) 
p  ~  JY(2000  lb/ ft3  ,  2.5  x  10s  lb3 /ft*) 

p°t  =  500  ft3  ,  pg3  =  2  x  104  ft3 /sec3  ,  p°3  =  2.5  x  10s  lb3 /ft*. 

Lea  courbes  r£preientent  respectivement  l’eireur  de  position,  vitesse  et  coefficient  ballis- 
tique,  ainsi  que  lei  racinei  carries  de*  Element*  sur  la  diagonale  de  P,  lesquelles  eitiment 
l’^cart  type  de  l’erreur. 

La  simulation  de  l’observation  a  4te  faite  sur  90  points  et  un  programme  g£n6ral,  capable 
de  resoudre  le  problfcme  de  filtrage  associe  a  des  Equations  d’etat  et  d’observation  de  dimension 
n  et  m  (respectiv.),  a  £t4  elabor£.  Pour chaque  exemple  il  suffira  de  donner  en  sous-programme 
les  fonctions  et  les  matrices  intervenantes. 


*-  -0  600E»02 


m  .t  rr  m 


On  constate  que  1’erreur  associ4e  au  coefficient  ballistique  reste  “asses  grande”  au  debut. 
Ce  comportement  est  du  au  fait  que,  pour  des  raisons  physiques,  les  mesures  obtenues  pendant 
que  l’objet  traverse,  h  grande  altitude,  une  atmosphere  de  basse  density,  contiennent  peu 
d’information  sur  p. 
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lemps  <  *ec.) 


lo+Hwro 
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2  Le  filtre  de  Katzur-Picard 


2.1  Presentation  du  filtre 

Considerons  le  problfcme  de  filtrage  non  lineaire  unidimensionnel  d4crit  par  les  equations  d’etat 
et  d’observation  r 

dXt  =  b(Xt)dt  +  cr(X,)dWt 
dYt  =  h(Xt)dt  +  cdWt 

avec  les  hypotheses  du  chapitre  precedent. 

On  s’interesse  k  l’estimation  du  signal  pour  les  petites  valeurs  de  la  covariance  du  bruit 
d’observation. 


Soit  kt  le  filtre  optimal  (donne  par  liquation  de  Zaka'i). 

Selon  un  resultat  du  k  Picard  (cf.  (Picard)),  si  aet  V  sont  uniformement  positives,  sous 
certaines  hypotheses, 

Xt  =  Xt  4-  0{  s/l)  (13) 

au  sens  oil  le  processus  et  =  Xt  —  Xt  (dependant  de  e)  verifie  : 

3e0  >  0  :  Vt0  >Oetl<q<oo  3c:  sup  ||etj|,  <  c-Jc  Ve  <  £0. 

tn<<<00 

On  peut  estimer  Xt  a  l’aide  du  filtre  de  Kalman  etendu  XtK£  (voir  1.3,  equations  (4)  et 
(5)  )  et  on  a  : 

XtKB  =  X,  +  C(s).  (14) 

J.  Picard,  It  qui  on  doit  aussi  le  resultat  precedent,  a  propose  un  filtre  approche  plus  simple 
que  le  filtre  de  Kalman  etendu.  Son  equation  est  : 

dMt  =  b{M,)dt  +  {dY,  -  k(Mt)dt)  .  (15) 

Ce  filtre  approche  le  filtre  optimal  avec  une  erreur  du  meme  ordre  que  le  filtre  de  Kalman 
etendu,  i.e. 

M,  =  Xt  +  0(c)  .  (16) 

En  ce  qui  concerne  l’estimation  du  signal  on  a  alors,  dans  les  deux  cas, 

x«E  =  x,  +  0(77)  (17) 


Mt  =  Xt  +  0(77)  (18) 

Ce  sont  ces  deux  resultats  qu’on  a  essaye  de  verifier  numeriquement. 

Dans  les  equations  du  filtre  de  Kalman  (voir  1.3,  equations  (4)  et  (5)  ),  et  dans  liquation 
du  filtre  de  Katzur-Picard,  le  terme  en  facteur  de  -  est  lui-meme  d’ordre  c  : 

On  se  place  dans  le  cas  particular  oil  a  =  C1 . 

D’apres  (IS), 

Mts  =  M, +  /  6(Ad,)ds+  -  /  {dY.  -  k(M.)ds)  .  (19) 

*  +  >  *  Jt.  £  J, „ 


v  .  - 
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dYt  =  htdt  +  di't ,  ou  v,  est  I’innovation 


K  =  E(h(Xt)\?\  =  h(Xt)+ 0(c), 


puisque  h(Xt)  =  h(Xt)  +  h'(Xt)  (*,  -  *,)  +  £A"(*<)  (xt  -  Xt)  ’  +  . . .  et 
d’aprfc*  (13). 
c> 

dYt  -  h(Aft)di  =  dt/t  +  (At  -  h(Mt))  dt  , 


oil  ht  —  h(Mt)  =  h( Xt)  -  h(Mt)  +  0(c),  car  h  est  supposee  lipschitzienne  et 
.  /■**+' 

Xt  -  Mt  —  0(c)  d’apres  (16).  Alors  l’integrale  /  (dY,  -  h(M.)ds)  est  d’ordre 

a 

e  et  quand  c  — •  0  le  facteur  —  dans  1’expression  (19)  est  “compensd"  par  cette 
integrate. 


On  peut  s’attendre  &  ce  que  la  discretisation  des  equations  detruise  cette  “compensation” 
et  que,  pour  les  petites  valeurs  de  c,  il  soit  necessaire  d’utiliser  des  petits  pas  de  temps  Awt. 

2.2  Discretisation  de  liquation  du  filtre  de  Katsur-Picard 

2.2.1  Premiere  mithode 

Un  schema  de  discretisation  possible  pour  l’equation  (15)  est  obtenu  de  la  fagon  suivante  : 

Mt»+  =  Af,.v  +  £  b(M.)ds  +  l  ft*+‘  <>(M.)  (dY.  -  K(M.)ds)  . 

Si  on  suppose  que  b(Mt)  ~  b(Mk  ),  h(Mt)  ~  h(Mk)  et  cr(Mt/  2:  a(Mk)  on  a  : 

AC i  =  W  +  H&k)*Mtk+i  +  1  -  h(Af?)&Ntk+l) 

fc  =  0,  1 

i.e. 

AC .  =  W  +  ) Av tk+ ,  +  (C ,  -  h(M? ))  (20) 


k  =  0,  -  1 


II  s’agit  d’un  schema  d’Euler. 


2.2.2  Deuxiime  mdthode 

On  propose  une  modification  de  la  discretisation  considere  dans  le  paragraphe  precedent 
(equation  (20)  ). 


r*  *  + 1 

On  rappelle  (voir  2.1)  que  /  (dY,  -  h(M,)ds)  est  d’ordre  c  mais,  en  discretisant,  on 
calcule  une  valeur  approchee  de  cette  integrate  avec  une  erreur  qui  n’est  pas  d’ordre  s. 


1 


•  V  •v’  O  ^ 


V 


■  VX'  V  \'  V’  X.'  «-■  ™  K_»  V_-  f  VJ1  H" X* 'Ll  H.TX."  V* X." X."  V  - v 
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3  Application 

3.1  Motivation 


Considerons  le  syst&me  non  lineaire  decrit  par  : 


dXt  =  b(Xt)dt  +  a[X,)dWt 
dY,  =  k(X,)dt  +  edWt 


(22) 


ou  W,  et  VV.  sont  des  processus  de  Wiener  standard. 

On  fait  les  hypotheses  du  chapitre  1. 

Supposons  que  la  fonction  A  est  bijective  “suffisamment  r6guli£re"  et  que  c  =  0.  Alors,  on 
peut  poser  h(Xt)  =  Zt  et,  d’apr&s  la  formule  de  Ito,  on  a  : 

dZt  =  lkt(Xt)dXt  +  l^{Xt)™'dt  (23) 

et,  puisque  Xt  =  h~l(Zt),  on  a  une  equation  en  Zt  =  Yt  (les  trajectoires  de  Y  sont  differen- 
tiables).  En  plus  Xt  peut  etre  connu  exactement  :  Xt  ~  A~l(Zt). 

On  considfcre  done  l’exemple  suivant,  unidimensionnel,  ou  6  est  une  fonction  lineaire  de 
Xt  et  h  une  fonction  injective,  dependant  d’un  parametre  A,  tels  que  : 

^lim  hx  =  ha,,  avec  :  [0,7]  x  IR  — ►  IR 

(t,X<)  -  Xt 

On  aura  done  pour  A  “asses  grand”  un  systeme  “presque  lineaire”  et  pour  e  “assez  petit”  les 
observations  seront  peu  bruitees,  de  fagon  a  s’approcher  du  systeme  : 

(  dXt  =  ~PX tdt  +  <rdWt 
\  dYt  =  Xtdt 

dont  on  connait  la  solution  Xt  =  Y . 

On  prend  cr  =  C‘. 


3.2  L’exemple  concret 

Les  equations  d’4tat  et  d’observation  sont  respectivement  : 

dXt  =  -pXtdt  +qU\Vt  ,  *0  ~ 

dYt  =  A  arctan  dt  +  e  dWt  ,  Y0  =  0 

ou  po  et  sont  donnes. 


a.  La  simulation  de  la  trajectoire  (Af((u/))0<t<T  conduit  (voir  chapitre  I)  a  la  formule  re- 
currentc  : 

=  exp {-2pbNt)XZ  +  a  ,  A"t  =  ~ 
ou  (£*)*  est  un  bruit  blanc  de  variance 


% 


> 


1  -  exp{  -  2/3  A N  t} 


Pour  la  simulation  de  [’observation  (vk)*=o.i . n  on  peut  proceder  de  deux  manieres 

differentes  : 

t.  Pour  chaque  pas  de  temps  ANt,  yk  est  donn£  par  : 

=  kk(tZ,XZ)+€Vk 

oil  vk  est  un  bruit  blanc  gaussien  de  variance  A N  t. 

2.  On  simule  d’abord  l’observation  pour  un  pas  de  temps  tres  petit  A M  t  et  on  utilise  cette 
information  pour  obtenir  l’observation  pour  un  pas  de  temps  A N  t  (M  multiple  de  N), 
i.e. 

t,n  —  ^  Yk+ 1  —  V-N  t’V 

&fc+l  —  ^7 7]  '  aVeC  ^  **+l  -  Pfc-t- 1  _  ‘  k 

ou  YkN+ ,  est  donne  par  : 

?,+  i  =  Yp“  +  Jp  +  wp+i  i  N  =  A///,  k  =  p/le  IN  . 
et  (u/p)p  est  un  bruit  blanc  gaussien  standard,  est  une  approximation  de  l’integrale 


j  V 

f  '+*M x.)d$t 

Jt* 


par  exemple,  /"  =  A(X",)AW(. 


f  M  V  M  y  A/ 

p  !>+l 


b.  L’application  des  Equations  du  filtre  de  Kalman  etendu  continu-discret  suppose  d’abord 
une  etape  de  prediction,  selon  laquelle  on  a  4  resoudre  deux  equations  diff4rentielles  ordinaire* 
(voir  chapitre  1).  Pour  cet  exemple  on  connait  leur  solution  explicite  : 

**  +  1  =  *‘+exp{-2/3A  *t*+1} 

Pt+l  =  (F+  -Oexp{-2/3A*lfc+1}  +  (  o4  <r2  =  i). 


Les  equations  d’actualisation  sont  : 


X *  =  Xk  +  Kk  -  4(  Xk  )j  ,  ou  h{ r)  =  A  arctan  — 

F*  =  [l  -KkH(Xk_\  Pt  ,  oil  H(x)  =  - 1— 

L  J  >  +  (!) 


Kk  =  Pl 


K{Xk) 

H'2(Xk)Pk  l  Rk 


ou  Rk  = 


A *ffc+1‘ 


•,•••*»  .N  “  *  *  .  '  -  .  *  »  •  *.  »S  ."W   •  .S %  \  V  ■  V  A N %  A  A  A  A  A  A  A  A  .N 
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L’application  de  1’  equation  du  filtre  de  Karzur-Picard  conduit,  aeion  la  discretisation  2.2.1, 
&  liquation  : 

MkN+l  =  +  (-/3  M?)  A*t  +  ^  [tf  -  h{M?)]  A*f 

et,  selon  la  discretisation  2.2.2,  h,  l’equation  : 

+  )*'<  + 7^*7 l»f -*(*.")! 

Pour  chaque  de  ces  trois  schemas  on  calcule  la  moyenne  empirique  de  l’erreur  sur  Ns 
simulations  ind£pendantes  : 

,fc(e,Awt)=  ,*  =  0,1, 

-  •'=  I 

et  l’erreur  quadratique  moyenne  : 

Ns  2 

!‘(*’4"0=s7g (*;-*;)  .*-«.> . *■ 

On  calcule  ausai  la  moyenne  suivante  (sur  les  fJV/2]  +  I  derniers  instants)  : 

r(g,Awt)  =  p~n  {  E 
1  1  >=|w/a| 

et  on  fait  des  representations  graphiques  des  valeurs  de  r  pour  les  diff£rentes  valeurs  de  A N  t 
et  de  e. 

3.2.1  Lea  results  ts 

a.  Lea  r6anltata  obtenns  par  le  filtre  de  Kalman  etendn 

a.l.  Si  on  considere  la  simulation  de  1’observation  decrite  en  premier  danS  paragraphe  3.2  on 
constate  le  ph6nom£ne  suivant  :  Bien  que  le  pas  de  temps  n’ait  pas  beaucoup  d’influence  sur 
l’ordre  de  grandeur  de  1'erreur  quadratique  moyenne  pour  e  “assez  grand”  (s  =  1  our  =  .l) 
il  n’est  pas  de  meme  pour  s  “petit”.  Dans  ce  dernier  cas  1’erreur  augmente,  presque  toujours, 
quand  le  pas  de  temps  Awf  diminue.  Bien  qu’on  ne  sache  pas  expliquer  cette  augmentation,  il 
n’y  a  pas  de  raison  pour  que  le  contraire  se  produise  :  puisqu’il  s’agit  de  simulations  distinctes 
on  ne  peut  pas  parler  de  gain  d’information  quand  le  pas  de  temps  diminue.  (voir  la  figure  1) 


a. 2.  On  considere  maintenant  la  2‘>m'  simulation  decrite  dans  le  meme  paragraphe. 

Pour  cette  nouvelle  fagon  de  simuler  1’observation,  on  peut  dire  qu’on  gagne  de  1’information 
si  on  diminue  le  pas  de  temps  et  on  s’attend  done  a  ce  que  1’erreur  quadratique  moyenne 
diminue  (ou  reste  constante)  avec  le  pas  de  temps,  (voir  la  figure  2) 

Comme  dans  le  cas  precedent  on  a,  pour  les  “grandes”  valeurs  de  e,  une  erreur  quadratique 
moyenne  qui  ne  depend  pratiquement  pas  du  pas  de  temps  mais,  par  contre,  pour  les  “petites” 
valeurs  de  e,  cette  erreur  diminue  avec  le  pas  de  temps  A t  pour  se  stabiliser  d&s  que  A t  est 
“assez  petit”  (At  ~  e).  Pour  les  2  dernihres  valeurs  de  e  (e  =  10~4  et  e  =  10-5)  l’erreur 
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quadratique  moyenne  n’a  pas  encore  attent  une  valeur  qu’on  puisse  consid^rer  constante.  En 
outre,  l’examen  de  ia  figure  1  montre  que,  dans  ces  2  derniers  cas,  la  valeur  stabilisee  de 
l’erreur  serait,  en  fait,  plus  grande  que  ce  que  laisse  penser  la  figure  2. 

On  6tudie  en  suite  le  comportement  de  rAt(c)  en  fonction  de  e,  en  utilisant  des  echelles 
logaritbmiques  -  uniquement  pour  les  4  premieres  valeure  de  e,  puisque  pour  les  2  derniferes  on 
n’a  pas  attent  une  situation  “stable”  On  obtient  des  courbes  polyedriques  qui  convergent, 
quand  A t  —*  0,  vers  une  droite,  i.e. 


log*-A»(c)  -  1  +  P  l08£)  • 


(voir  la  figure  3) 


P  e  n  t  e  - 

I  •  no  a  - 


0  .  1  O  6  E  ♦  0  1 
0  .  2  4  5  E  +  0  O 


•  5*lo|(«pitlon) 


Figure  3:  l’erreur  quadratique  moyenne  en  fonction  de  e,  pour  le  filtre  de  Kalman  etendu. 

Les  valeurs  trouvees  pour  p  etq  conduisent  a  Papproximation  : 

raf(e)  *  10-°  ,4SC°  S3. 

On  a  done,  effectivement,  une  erreur  quadratique  moyenne  d'ordre  proebe  de 

Xt  -  M,  ~  0W1). 


,•  >  ,*  mm  *  /  ^  _*  .*  •  •  ■»  •  *  ^  #  •  •  «  s  a  «  m  •  «  •  •  ■  »  ’  r  •  ( 

.V.--  A  .N  v  --  N.N 


■V.v;/  * 
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b.  Lea  rianltata  obtenui  pour  le  filtre  de  Katsnr-Picard.  On  utilise  la  fagon  de 
simuler  l’observation  d&rrite  en  2,imt  au  paragraphe  3.2. 

b.l.  Pour  le  schema  de  discretisation  de  liquation  du  filtre  d6crit  au  paragraphe  2.2.1,  les 
courbes  r,(Af)  et  ra,t(ff)  sont  repr^sentees  (respectiv.)  dans  les  figures  4  et  6. 


Figure  4:  1’erreur  quadratique  moyenne  en  fonction  du  pas  de  temps,  pour  le  filtre  de 
Katzur-Picard. 

On  obtient,  pour  les  “grandes”  valeurs  de  e  (e  =  1  ou  e  =  0.1)  des  courbes  rf(At)  qui 
ressemblent  h  celles  de  la  figure  2.  Par  centre,  pour  les  “petites*  valeurs  de  c,  on  commence 
par  avoir  une  erreur  quadratique  moyenne  “enorme”  pour  les  “grandes*  valeurs  de  At  et  on 
attent  un  point  “stable*  pour  les  “petites"  valeurs  de  At,  sauf  pour  c  =  10-<  et  t  —  10“5 
(voir  la  figure  4). 

On  a  done  utilise  seulement  les  resuitats  obtenus  pour  les  4  premieres  valeurs  de  c  pour 
tracer  les  courbes  rA4(e),  r4presentes  dans  la  figure  6  (comparer  avec  les  figures  3  et  7). 

On  peut  trouver  une  explication  de  ce  comportement  dans  le  fait  que  (voir  ebapitre  2), 
quand  c  est  “trop  petit  devant  At"  (c  <K  At),  on  risque  d’avoir  des  acroissements  abrupts  dans 
liquation  r^currente  du  filtre.  On  obtient  des  courbes  trbs  differentes  de  celles  de  la  figure  3. 
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On  observe  n£anmoins  que  ces  courbes  tendent,  quand  At  — »  0,  vers  une  droite  d’equation 

—  log  r  =  -7  -  |  logs, 

avec  Tf  =  0.270  et  p  =  1.01,  i.e. 

r  ~  10-0.27OeO.SO5 

et  done,  quand  e  — •  0,  on  a  encore  une  erreur  quadratique  moyenne  proche  de  0[y/e). 

b.2.  On  consktere  dans  la  suite  les  resultats  obtenus  quand  on  utilise  la  modification  du 
schema  de  discretisation  du  filtre  d4crite  au  paragraphe  2.2.2. 

On  a  pris  la  constante  c  egale  i  1.  Les  figures  8  et  9  represented  (respectivement)  l’erreur 
quadratique  moyenne  en  fonction  du  pa^  de  temps  et  l’erreur  quadratique  moyenne  en  fonction 
de  e. 


S 


-lo|(p»i  de  lempa) 


Figure  8:  l’erreur  quadratique  moyenne  en  fonction  du  pas  de  temps,  pour  le  filtre  de 
Katzur-Picard  (selon  la  modification  2.2.2). 


On  constate  qu’on  n’a  plus  le  phenomene  desagreable  d’explosion  de  l’erreur  pour  les 
grandes  valeurs  de  At  et  les  petites  valeurs  de  e  et  on  obtient  des  valeurs  stabilises  de  r  de 
la  meme  ordre  de  grandeur  de  celles  obtenues  dans  3.2.1  (comparer  les  figures  8  et  5). 
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Figure  9:  l’erreur  quadratique  moyenne  en  fonction  de  c,  pour  le  filtre  de  Katzur-Picard  (selon 
la  modification  2.2.2). 
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Pour  leg  courbes  rAt(e)  de  1’erreur  quadratique  moyenne  en  fonction  de  e  (voir  la  figure 
9)  on  a  trouve  comme  “droite  limite”,  quand  A t  — »  0,  la  droite  d’equation  : 

-  l°gfAt(£)  =  0.318  +  0.9l4(-j  logs), 


rAt(«)  ~  10-°  3,V  457. 

On  est  maintenant  un  peu  au  dessous  de  l’ordre  0[\/7)  mais,  par  contre,  on  a  une  constante 
plus  petite  que  celle  de  la  figure  5. 

3.2.2  Remarquea 

On  a  v^rifie  numeriquement  les  resultats  (17)  et  (18)  du  chapitre  2.  EfFectivement,  on  a  obtenu 
pour  ces  deux  filtres,  le  filtre  de  Kalman  etendu  et  !e  filtre  de  Katzur-Picard,  la  meme  ordre 
d’erreur.  II  faut  tout  de  meme  remarquer  la  simpiicite  du  deuxieme  filtre  par  rapport  au 
premier. 

II  serait  interessant  de  resoudre  (’equation  de  Zakai  pour  obtenir  la  densite  conditionnelle 
q(t,x)  et  ainsi  calculer  le  filtre  optimal  Xt.  Au  lieu  d’etudier  I’erreur  quadratique  moyenne 
par  rapport  au  signal  simule  on  pourrait  alors  faire  la  meme  etude  par  rapport  a  Xt  et 
essayer  de  verifier  numeriquement  le  resultat  theorique  (16)  (voir  chapitre  2,  paragraphe  2.1) 
qui  predit  un  ecart  d’ordre  e. 

On  pourrait  aussi  etudier  numeriquement  i’ecart  entre  le  filtre  de  Kalman  etendu  et  le 
filtre  de  Katzur-Picard  qui,  theoriquement  est  d’ordre  c. 


REFERENCES 


33 


References 

[Arnold] 

[Gelb] 

[Jazwinski  1] 
[Jazwinski  2] 

[Lipster  -  Shiryayev] 
[Pardouxj 
[Pardoux  -  Talay] 

[Picard) 

[Talay] 


Arnold,  L.  :  Stochastic  differential  Equations.  Theory  and  Applica¬ 
tions.  Jonh  Willey  &  sons  (1974). 

Gelb,  A.  :  Applied  Optima!  Estimation,  by  The  Technical  Staff,  The 
Analytic  Sciences  Corporation.  M.I.T.  Press  (1974). 

Jazwinski,  A.  :  Filtering  for  nonlinear  dynamic  systems.  I.E.E.E. 
Transactions  on  Automatic  Control,  1966,  Tome  11. 

Jazwinski,  A.  :  Mathematics  in  Science  and  Engeneering,  vol.  64, 
Stochastic  Processes  and  Filtering  Theory.  Academic  Press  (1970). 

Lipster  -  Shiryayev  :  Statistics  of  Random  Processes  II,  Applications. 
Springer-  Verlag. 

Pardoux,  E.  :  Equations  du  filtrage  non  lineaire,  de  la  prediction  et 
du  lissage.  Stochastics  1982,  vol. 6. 

Pardoux,  E.  -  Talay,  D.  :  Discretization  and  simulation  of  stochas¬ 
tic  differential  equations.  1985  -  Acta  Applicandae  Mathematicae 
(S), 1,23-47. 

Picard,  J.  :  Nonlinear  filtering  of  one-dimensional  diffusions  in  the 
case  of  a  high  signal-to-noise  ratio.  1986  -  SIAM  J.  Appl.  Math. 
(46),  6, 1098-1125. 

Talay,  D.  :  Analyse  numerique  des  equations  differentielles  stochas- 
tiques,  these  de  doctorat  de  troisieme  cycle  en  Mathematiques  Ap- 
pliquees,  soutenu  le  25  Juin  1982. 


Piecewice  linear  filtering  with  small  observation  noise. 


W.H..  Fleming*,  D.  Ji*  and  E.  Pardoux* 


Abstract  :  We  consider  a  piecewise  linear  Filtering  problem  with  small  observation  noise.  It  is 
shown  that  one  can  construct  an  approximate  Finite  dimensional  Filter  which  uses  a  bunch  of 
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1.  Introduction. 


The  aim  of  this  paper  is  to  propose  an  approximate  optimal  filter  for  the  filtering 

problem : 

dxt  =  f(xt)dt  +  dwt 
dy,  =  h(x,)dt  +  edvt 

where  (xt)  is  a  scalar  unobserved  process,  (yt)  is  a  scalar  observed  process,  e  is  a  "small" 
parameter,  {wt}  and  (vt)  are  mutually  independent  standard  Wiener  processes.  We  assume  that 

t 

R  =  KJ  I.  ,  where  , ...  ,  Ie  are  disjoint  intervals,  f  and  h  are  continuous  mappings  from 

R  into  R ,  whose  restrictions  to  each  Kj  are  affine. 

Roughly  speaking,  our  result  is  as  follows.  Provided  a  certain  "detectability  hypothesis"  is 
satisfied,  an  approximate  optimal  filter  is  given  by  one  of  a  set  of  E  Kalman  filters,  the  decision 
about  which  Kalman  filter  to  follow  for  a  given  period  of  time  being  taken  in  view  of  the  outputs  of 
the  E  Kalman  filters. 

Let  us  sketch  the  general  ideas  on  a  simple  example.  Suppose  that  E  =  2,  I,  =  R_  and 
I2  =  R  +  .  Suppose  that  : 


f(x)  = 


F+  x  ,  x  >  0  , 
F.  x  ,  x<0. 


h(x)  = 


H+  x  ,  x  >  0  , 
H  x  ,  x  <0  . 


We  now  consider  the  two  linear  filtering  problems  : 


fdx,  =  F+  x(  dt  +  dw( 
[dyt  =  H+  xt  dt  +  e  dv( 


im  -  »  * 


dxt  =  F  xt  dt  +  dw£ 


[dyt  =  H  xt  dt  +  e  dvt 

to  which  one  associates  two  Kalman  filters  (KF+)  and  (KFJ  ,  with  outputs 

(  xt+  ,  Rt+  )  and  (  xt- ,  Rt' ). 


If  H+  H.  >  0,  then  h  is  one  to  one,  and  since  £  is  small,  we  can  almost  deduce  from 
{ ys ,  s  <  t  }  the  current  value  of  h  (xt),  hence  of  xt .  More  precisely,  from  the  results  of  Picard 
[8], [9], [10]  (  see  also  Katzur  -  Bobrovsky  -  Schuss  [6],  Bensoussan  [1],  Ji  [5],  we  know  that  the 
conditional  law  of  xt,  given  ,yt  =  a{ys;0<s^t}  has  a  small  variance  . 

If  for  instance  xs+  >  0  and  is  significantly  different  from  zero  for  any  se  [  t  -  a,  t  ]  (in  which 
the  same  is  true  for  xs' ),  the  conditional  law  of  xt  given  ^ t  is  almost  completely  concentrated  on 
IR+  (at  least  with  probability  almost  one  )  and  consequently  the  output  of  (  K  F+  )  is  very  close  to 
the  conditional  law  of  xt,  given  (  as  we  will  see  below,  the  way  in  which  (  K  F+  )  is  initialized 
does  not  play  a  significant  role  ),  at  least  with  probability  almost  one. 

Suppose  now  that  H+  H.  <  0  .  Then  we  need  some  "  detectability  hypothesis  Indeed,  if 
f(x)  s  0  and  h(x)  =  lxl,  then  clearly  the  conditional  law  of  Xt  given  is  symmetric  with  respect 
to  0,  and  cannot  be  reasonably  approximated  by  the  output  of  a  Kalman  filter. 

Suppose  now  that  I  H+l  *  I  Hj.  Then  ,  for  e  =  0,  the  quadratic  variation  of 

dyt 

-r-  =  h(x.)  tells  us  whether  x.  <  0  or  x,  >  0  . 
dt  *  1  1 

One  may  then  expect  that  for  £  >  0  but  small,  the  conditional  law  of  X(  given  has  again  a 
small  variance,  and  that  a  decision  about  which  of  (  K  F+)  or  (  K  F.)  to  follow  might  be  reached 
by  comparing  the  outputs  of  these  two  filters.  The  proof  these  facts  is  the  crucial  step  in  our 
argumentation. 

Our  result  are  illustrated  by  the  numerical  results  in  Fleming  et  all  [3]  .  Let  us  insist  upon  the 
fact  that  the  hypothesis  of  a  high  signal  -  to  -  noise  ratio  is  crucial  for  the  validity  of  the  algorithm 
which  we  propose  .  Without  that  hypothesis,  the  conditional  law  would  spread  out  over  the  whole 
real  line,  and  probably  none  of  the  Kalman  filters  would  give  an  acceptable  approximation  of  the 
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conditional  law.  A  totally  different  algorithm  is  proposed  for  that  situation  in  Pardoux  -  Savona 


Generalisations  to  higher  dimensional  situations,  as  well  as  to  the  case  where  f  and  h  are 


nonlinear  and  h  piecewise  one  to  one,  will  be  considered  elsewhere. 


The  paper  is  organised  as  follows.  In  section  2,  we  formulate  precisely  the  problem  and  the 
assumptions,  as  well  as  some  technical  results  which  will  be  needed  in  the  sequel.  Sections  3,4 
and  5  study  in  detail  the  case  where  6=2,  Ij=  IR_ ,  1^=  IR  +  ,  and  h  is  not  globally  one  -  to  -  one 
and  satisfies  a  "detectability  hypothesis".  In  section  6,  we  summarize  an  approximate  filtering 
procedure  for  the  case  studied  in  the  previous  sections,  and  indicate  the  procedure  in  the  general 


2.  Formulation  of  the  problem  and  preliminary  lemmas. 

We  consider  the  two-dimensional  process  { (  x,,yt ),  t  >  0  }  which  solves  the  following 
stochastic  differential  system : 

(2.1)  xt  =  x0+  JQ  f(xs)ds  +  wt 

(2.2)  y,  =  \Q  h(xs)  ds  +  e  v, 

Here  (wt)  and  {vt}  are  two  mutually  independent  standard  Wiener  processes,  x0  is  a  random 
variable  independent  of  {  wt,  vt ;  t  >  0  }  with  E[exp(cxQ^)]  <  °°  for  some  c  >  0,  defined  on  a 
probability  space  (  Q,  7 ,  P ) ;  f  and  h  are  continuous  mappings  from  1R  into  IR  ,  which 
have  the  following  special  form.  We  assume  that  !R  =  Ij ,  where  Ij IE  are  closed 

intervals  with  disjoint  interiors,  and  the  restrictions  of  f  and  h  to  each  Ij  are  affine  functions  ,  i.  e. 
f(x)  =  F  x  +  fj  ,  x  g  I-  ;  1  <  i  <  6 


v.V.v.v.Av.v.v;ffl^ 
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h(x)  =  Hj  x  +  h;  ,  x  e  L  ;  1  <  1  <  £ 

where  Fj Fg  ,  fg  ,  Gj  ).»•*  Gg  ,  *•••»  §g  £  1R» 

{xt}  is  an  unobserved  process, while  {yt}  is  observed.  We  define  : 

*»=  a(ys;  o<  s  <t} 

and  seek  to  compute  at  each  time  t  the  conditional  law  of  xt  given  .  Our  aim  is  in  fact  to 
obtain  an  asymptotic  result,  as  e  — >  0,  concerning  a  finite  dimensional  filter  to  be  described  later. 
We  will  assume  throughout  the  paper  that : 

(Hi)  H^O  ;  1  <  i  <  £ 

let  us  now  formulate  a  "detectability  hypothesis"  which  will  be  assumed  to  hold  throughout  the 
paper : 


For  any  point  (i,j)  €  {1, ...,£}  s.t. 
i  *  j  and  h(IL)nh(ip  has  a  non  void  interior. 


For  i  =  1, ...,£,  we  can  consider  a  Kalman  filter  (  K  Ft ),  which  is  the  optimal  filter  for  the 
case  where  : 

f(x)  =  Fj  x  +  f;  ,  h(x)  =  Hix  +  hi,Vxe  R  . 

The  Riccati  equation  for  the  conditional  covariance  in  (  K  F; )  reads  : 


2Fj  R‘  +  1  - 


(  h,  r;  )2 


This  equation  has  for  small  e  a  unique  stable  positive  invariant  solution,  equal  to 


2  2 
e  F. 


2  2 
e  F; 


Let  us  define  K;  =  I  /  1  +  — —  +  e  ^  signCH^ 


The  optimal  Kalman  filter  associated  to  the  initial  law  N(  E(x0) ,  e  K;  /  H; )  is  given  by 


d  x  =  (  Fj  x] [+  I )  dt  +  —  ( d  y  -  H;  xl  dt ) 
(KFj)  e 

.  xo  =  E(xo) 


In  most  of  the  paper,  we  will  concentrate  on  the  case  £  =  2,  in  the  which  we  will  assume. 


without  loss  of  generality,  that : 


We  will  then  use  the  notations 


fj  ~  ^2  ~  ^1  =  ^2  —  0, 

it*  R  .i2=r+ 

I.  =Ij  ,  F  =  Fj  ,  H  =  Hj 
1+  =I2>  F+  =  F2  .  H+  =  ^ 


Let  us  close  this  section  with  three  lemmas. 


Lemma  2-1 

Let  U,  UM  be  i  .i  .  d.  random  variables,  with  joint  law  N(  0 , 8  )  .  Then  for  any 
a  >  0  , 


P  max  IUul>a  <l-  l-e 


^  Va  .*»  A  .v'.v.s  .V.\  V  vvv  Ca-a  aVv  V 


Consequently,  when  8  — » 0  and  M  — »  +  °°  in  such  a  way  that  M8  =  C  , 


P  max  I  Uk  I  >  a  <  Me 
v  i<k<M  J 


Proof  : 


If  0  is  a  r  .  v.  with  law  N(  0,  1  ), 


P  ( 1 0  I  >  a )  = 


-V  -a/2 

e  dz  <  e 


Consequently, 


P  max  I  Uk  I  <  a 
Vl<k<M 


M'-V  a 

P  — =  <  — = 


fh  /l 


>  1  -  e 


Lemma  2.2 

Let  {  •  n  e  IN  }  be  a  sequence  of  i.  i.  d.  random  variables  .Let  <E>  (u)  =  E  [  exp  (u  )]. 

Suppose  that  <I>  is  finite  on  a  neighbourhood  of  the  origin,  and  that  (u  ;  d>  (  u  )  <  k  }  is  closed 
for  any  k  e  1R+  .  Call  p  the  common  mean  of  the  ^’s  .  For  any  0  >  0  ,  there  exist  C  >  0  such 


that  for  any  n  6  IN  : 


P  I  -  'Ll  -  \i  I  >0  <  CenC 

n  j 


Proof: 


this  is  a  large  deviation  estimate,  which  can  be  found  e.  g.  in  Ellis  [2]. 


Lemma  2.3 


Let  {  xt ,  t  >  0  }  denote  the  solution  of  (  2.1  ) .  Then  for  any  t  >  0  ,  there  exists 
c  >  0  such  that  E  exp  [~  c  f  sup  x*  1  <  -h»  . 


Proof: 


This  is  Theorem  5.7.2  in  Kallianpur  [5]. 


3.-  The  case  of  two  intervals  with  H+  H.  <  0.  First  step. 

We  shall  treat  the  case  H+  >  0  ,  H  <  0  ( i.  e.  h  (x)  >  0,  V  x  )  and  use  the  notations 
I  H 1  =  sup  (  H+  ,  -  H  )  ,  IF  I  =  sup  ( IF+I,  !FJ  ).  Recall  that  assumption  (H2)  is  in  force. 

Since  we  want  to  decide  on  which  side  of  0  xt  is,  we  First  need  to  find  intervals  of  time  on 
which  no  zero  crossing  takes  place,  at  least  with  conditional  probability  almost  one. 

let  0  <  a  <  b  ,  M  =  — ~ —  ]  ,  and  for  E  =  0  ,  1  ,...,  M  -  1,  define  : 


Y  =  _  ( v  -v  ) 

1  ,  v  C+l  )e  •'a+l  £  ' 


S{  =  - 


a+  (C-t-1)  £ 


h  (  x  )  ds 


Be 


(  V  —  V 

a+(C+l)£  a+fi  £ 


v,  = 

Note  that 

Ys  =  S6  +  V{ 

Define  moreover  the  events  : 

B+  ( a , b  )  =  {  xt>0;  a  <  t  <  b  } 

B.  (a,b)=  {  xt  <  0;  a  <  t  <  b  }. 

In  case  when  there  is  no  ambiguity,  we  shall  simply  write  B+  and  B  . 

Choose  c  >  0,  and  define  : 

C  =  (  I  YE I  >  c  ;  0  <fi<  M  -  1  } 

Proposition  3.1 

For  any  e0  >  0  ,  there  exists  k  s.t .  for  any  e  e  (  0,  Eq  ) 
P((B+uB.)c/C)  <ke'y£  . 

Proof  : 

If  I  Y6 1  >  c  and  I  Ve  I  <  -y-  ,  then  1  Se  1  > 
t6  e  [a  +  Ce,a  +  (t  +  l)e]  s.  t. : 

'  h  (xl{)i  a  4 

and 

I  x,  I  >  c,  =  c/2  IHI  . 

t5  i 


It  follows  that  on  (B+  u  B_)c  n  C,  we  must  have  either  : 


sup  I  V6  I  >  -y 
0<k<M-l  z 


or  else 


sup  sup  I  xt -  xs  I  >  Cj 

0<8<M-1  a+Ce<s<t<a+(8+l)E 


From  lemma  2.1,  V  Eq  >  0  ,  3  c0  >  0  s.  t. ,  Veg  (0,£0)  , 


C  'C0/E 

P(  sup  IVjl  >  -y)  <  c0  e 


Now,  for  a+E£<s<t<a+  (£+!)£, 


|  xt  -  xs  I  <  £  I  F  I  (sugj  xt  I)  +  I  wt  -  ws 


Consequently, 


{  sup  sup  lxt-  xsl  >  Cj  }  c 

t  <M-1  a+C£<s<i<a+<8+l)€ 


'■'l 

c  {  sup/x/  > - }  u  (  sup  sup  /wt  -  W  /  >  -j 

a<l<b  2£/F/  9<M-1  a<t£<l<a+(t+l)£  * 


It  follows  readily  from  lemma  2.3  that  there  exists  c2.  s.  t.  : 


C1  -Cqjt" 

P(  sup  Ix.l  > - )  <  c,  e 

a<t<b  2eIFI 


Noting  that  the  sequence 


{  sup  lwt'wa+eE^  is  i.i.d.  , 

a+t£<t<a-t-(J+l)E 


and  that : 


c  c 

P(  sup  lwt  -  wa+6£>  * -j)  =  2  P  (lw£|  >  -±) 

a+t£<t<a+<e+l)£ 


It  follows  from  the  proof  of  lemma  2.1  that 


Ve  >  0, 3  c3  s.t.  Ve  <  e0> 


n  -Cj/E 

P(  sup  sup  |wrwa+t|l>-^-)<c3e  | 

t<M-l  a+t£<t<a+<6+l)E  ^ 


Finally,  it  easily  follows  from  the  above  that  P(C)  is  of  the  order  of  one,  Ve  >  0  . 


■..v 

..... 


4.  The  case  of  two  intervals  with  H+H_  <  0  .  Second  step. 

We  now  want  to  show  that,  once  we  know  that  no  zero  crossing  has  occured  on  [a,b] 
with  probability  almost  one,  then  we  know  whether  {xjj  >  0)  or  {x^  <  0}  ,  with  a  very  small 
probability  of  error. 

For  that  sake,  let  us  define,  with  the  notations  introduced  in  the  last  section  : 

I  <  v,  •  \  >2 

0<8<M-1;  5  odd 

I  -  Y.  >2 

0<8<M-1;  6  even 


z°  = 


b  -  a 


Ze  = 


b  -  a 


On  B+ , 


e+i 


Y,  = 


S8+l  '  S8  + 


8+1 


V„ 


^-a+(8+l)e 

r  s+e 

H+ 

H+F+ 

e 

J 

(ws+e'  ds  +  v,+i- V,  + 

^  J 

xudu  ds 

J  J 

a+8e  a+8e 


z°  = 

E 


1 

b  -  a 


I  a 

8  odd 


ze 


1 

b  -  a 


I 

8  even 


a. 


+ 


1 

b-a 


8  even 


+  2  ac  ) 


where  : 
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a+<l+l)£ 


(nVe  -  ws)ds  +  \t  -  Vg 


H+F, 


a+(8+l)£  rs+c 


xu  du  ds 


a+£e  s 


Note  that  af  N(  0 , 2e(l  +  H+2/  3  ) ) ,  and  both  sequences  {  ae ;  6  odd  }  and  {  af ; 

E  even  }  are  i.  i.  d. .  Call  M0  the  number  of  odd  integers  in  the  interval  [0  ,  M  -  1]  ,  and  Me  the 


eM0  eMe 


number  of  even  integers  on  the  same  interval,  and  define  pQ  =  g — -  ,  pe  =  -g — -  .  Note 
po  and  pe  are  both  close  to  1/2  . 


We  are  going  to  show  that : 

Lemma  4.1 

For  any  0  and  e0  >  0  ,  there  exists  c  >  0  s.t  for  any  £  e  (0,  e0)  , 


PI  (  |Ze°  -  2p0  (1  +  — )|  >  9}nB  I  <  ce 


:/V  E 


P  {  |Ze°  -  2p0  (  1  +  —  )|  >  0  I  nB.  <  ce 


:/V  e 


and  similar  estimates  hold  with  Z£°  replaced  by  Z£e,  p0  by  pe  . 


Let  us  first  see  the  conclusion  which  can  be  drawn  from  lemma  4.1.  Suppose  to  fix  the  ideas 
that  H+2>  H.2  . 

Define  : 


W-\. 


V 


=  C  n  zeu  >  p0  2 


Hr  +  h 


c  =  cn  jz;<Po  i 2  + 


h2  +  h2 


Note  that  C+uC  =  C  ,  and  C+  n  C  =  0 


Proposition  4.2 

For  any  e0  >  0  ,  there  exists  k  s.t. 


P(B+c/C+)  <  ke 


-  k  /  V  e 


P(Bc/C  )  <  ke'kN  E 


for  any  e  e  (0  ,  e0) . 


Proof  : 


Let  us  prove  the  First  assertion.  It  suffices  to  estimate  the  quantity  : 

P  ( B+c  oCj. 


P(B+cnCJ  <  P(  (B+uB_)cnC)+  P  B.n  (  |z°  -  2pQ  (  1  +  )  I  >  6  } 


Po  2  "> 

where  0  =  — (  H+  -  H  "  )  .  The  desired  estimate  then  follows  from  Proposition  3.1  and 


Lemma  4. 1.  □ 


V  V  '  * .  /.  j"  s 


vs 


Proof  of  lemma  4.1 


Let  us  prove  the  first  estimate.  We  need  to  estimate  the  following  three  events  : 


G  = 


2  2 
2,  (a.  -  Ea,  ) 


E  odd 


b  -  a 

>  — 9 


b  -  a 

IT 


0 


The  existence  of  c  >  0  s.t. 


P(G)  <  c  e- c/£ 


follows  from  Lemma  2.2.  Note  moreover  that 

1  I  P(2  ^  e(H+F+)2 


b  -  a 


S  odd 


f 

sup 

v TG  hi-^l 


2 

X 

X 


\ 


Using  Lemma  2.3  and  the  Markov  inequality,  we  then  deduce  the  existence  of  c  >  0  s.t. 

P(H)<cec/£ 


Note  that : 


\r  .  .  x 

f  \ 

0  1 

sup  let  |  be 
[V  |C  odd)  J 

sup  1 Xt 1 

^  Te[ii.i2]  J 

5  6IH.F.I'] 

' 

1/4 

0  £ 

■u  • 

-  1/4 

sup  let  1 
(G  odd) 

sup  1 Xjl  >  E 

SIH.F.Ij 

Using  Lemma  2.1  and  Lemma  2.3,  we  deduce  : 


The  result  now  follows  from  the  three  above  estimates  .  □ 


5.  The  case  of  two  intervals  with  H+H_  <  0  .  Third  step. 

We  want  now  to  show  how  the  decision  between  (xb>0)  and  { xb<  0 }  can  be  made  from 
the  outputs  of  the  two  Kalman  filters  (KF^  and  (KF  )  .  For  a  <  e  <  b  ,  let  us  define  the  test 


statistics : 


L  =  —  (  H+  x$+  -  H  x;  )  dys  -  —  ( !  H+  x$+  I2  -  I  H.  x$  I2  )  ds 


Using  the  representation : 

A 

dys  =  hs  ds  +  e  d  v  s 

A 

where  hs  =  E  (  h(xs)/ys)  and  { vt }  -  the  innovation  -  is  a  standard  Wiener  process.  L£  can  be 

rewritten  in  two  ways  : 

f b  rb 

L  =  —  |  H+x  +  -  H  x  I2  ds  +  (  H+  xs+  -  H  xs  )  dVs  + 

£  2e 


+  —  (  H+  xs+  -  H  xs'  )(  h5  -  H+  xs+  )  ds 

e 


and  also  : 


fb  f 

(5.2)  L  =  -  — -  I  H.x,*  -  H  x,  I2  ds  +  (  H.  x,*  -  H  x,  )  d«,  + 

2eJ  J 


b 


+  —  (  H+  x  +  -  H  x  '  )(  h  -  H  x ' )  ds 


Define  C+  (a,e)  an  C  (a,e)  as  in  §  4,  but  with  the  interval  [a,b]  replaced  by  [a,e] 


Define  morewer : 


\yt~-  y. 


x  =  inf  {  t ;  t  =  a  +  Ee,  C  <  M  -  1  ;  t  >  e ;  -  <  c  ) 

e 


where  c  is  the  constant  which  is  used  for  the  definition  of  the  event  C  . 


We  want  to  estimate  : 


E  (  L  I  hs  ■  xs+  I  ds  ;  C+  (a  ,  e)  ) 


as  well  as  the  same  quantity  with  +  replaced  by  - . 

We  decompose : 

hs  -  H+  xs+  =  h.  -  H+  xs+  +  H+  ( xs+  -  xs+ ) 
where  x^  is  the  conditional  mean  of  xs ,  given  ,  in  the  following  filtering  problem  : 


dxt  =  l(t<a}  +  F+Xt  )dt  +  dwt+ 
dyt  =  (h(xt)l(tSl}  +  H+  xt  1  (c>aj  )dt  +  edvt+  . 


Definie  \  =  F+x(  -  f(xt) ,  yt  =  H+  xt  -  h(xt)  , 


exp  Xs  dws 


12  1 

t  ds  +  -  ysdvs 

e 


1  2 

—  y  ds  ,  a  <  t  <  b 
2  s 

2e  J 


ur 

Then  Zt  =  \7  •  where  p  is  the  initial  law  on  (Q.J),  and  {w(  }  ,  (V,  )  are  mutually 


independent  standard  Wiener  process  under  P+  . 


J 

1 


S> 


WWW 


dZt  =  \  zt  dwt  +  —  7t  Zt  dvt ,  t  >  a  ;  Z=\ 
e 


dyt  =  h(xt)  dt  +  e  dvt 


It  follows  from  the  theory  of  filtering  that : 


A  1  A  A.  +  + 

dZt  =  —  Zt  (  ht  -  ht  +  yt  )dvt 
E 


where  Zt  =  E  (  Zt/^t)  ,  ht+  =  E*  (  h(xt)  /  )  ,  yt  =  E+  (  yj  )  and  {  }  is  the 


P+  innovation,  i .  e  .  : 


Clearly, 


dyt  =  H+xt+dt  +  edvt  ,  t  >  a 


/V  1  ^  + 
dZt  =  —  Zt  (  H+  xt  -  h,)dv 
e 


exp  —  (H+  xs+  -  hs )  dvs 


1  .  A  o 

—  I  H+  xs  -  hs  I  ds 

2  £  v 

a 


A 

Z  (Z 


Ze  V^e 


i  x  # 

But  7T-  =  E  .It  then  follows  from  Jensen  inequality  and  the  fact  that 


C+(a,e)  e  : 


ta  >  LT*  .  -  »  .  » 


+  ^2 


E  I  H+  xs  -  hs  I  ds  ;  C+(a,e)  <  £  E  I  F+  x,  -  f(xs)  I2  ds ;  C+(a,e)  + 


+  E  I  H+  x$  -  h(xs)  I  ds  ;  C+(a,e) 


It  now  follows  readily  from  Propostion  4.2 


Lemma  5.1  For  any  e0  >  o.  there  exists  k  s.t.  Vee  (O.Eo)  , 


.+  u  ,2 


E  IH+xs  -  hs  1  ds  ;  C+(a,e)  <  k  e 


and  the  same  result  holds  with  +  replaced  by  □ 
Note  that  the  same  bound  holds  for  the  quantity  : 


-  k/>/  e 


H+V  -  hs  l2  ds  ;  C+(a,e)  D  C(a,b) 


We  need  now  to  estimate  the  difference  l<xs+-xs+l  ,  e<s<b  .  Note  that  {xt+  ,  t  >  a} 
and  {'xt+  ,  t<a)  are  solutions  of  the  same  linear  filtering  problem  with  different  initial  laws,  the 

second  one  being  non  gaussian.  Let  ^ta  =  a(ys  -  ya ;  a  <  s  <  t)  ,  t  >a  ,  Since  and  a(xa)v 
1*taare  conditionally  independant  given  o(xa) ,  for  t  >  a  , 

(5.4)  =  E+[E+(xt/xa,  S,a)/V- 

Define  x^t+  :=  E+(  xt/xa  ,  ^ta )  .  x^t+  is  the  output  of  a  Kalman  filter.  More  precisely,  we 


'.  <»*  '«#  .  *  .  <  -  *  -*'k*k*kl,lkT  •  "  <*•  •  *  M  *  a  ■  »  *  «  •  .  a*.***.*,*,  •  •  ,  a.*  a*  /  «*,  *'  a',  a*.  *  _  «a"*_  a*  < 


d  Xal  =  F+  Xa,l  dt  +  - 0  (  dyt  '  H+  Xa,"  dt  )  ’  1  *  a  i  Xa,a  =  Xa 


d  (  H+  Ra  t  )z 

dFRa,  =  2F+Ra.t  +  1 - 2 -  ’  t2Sa  ;  Ra,a  =  0- 

e 


rJh+ 

Define  K+(t)  =  -  .  It  is  easily  seen  that  V  p  >  0  ,  3  k  s.t.  V  t  >  a  +  p 


I  K+-  K+(t)  I  <  k  e'WE  . 


Morever, 


( 

d(  xt+  -  Xa!t  )  =  F+ - (xt+  -  Xa.Dd‘  + 

l  e  ) 

H  K+  -  K+(t) 

+  (K+  -  K+(t))—  xa>  +  - d yk)h> 

e  e 

+  +•  4- 

X,  -  X,  „  =  x,  -  X,  . 
a  a,a  a  a 


Since  K+  H+  >  0  ,  it  follows  from  (5.5),  (5.6)  that  there  exists  k  s.t.  V  e  >  0 


V  t  e  [e,b], 


I  xa+  -  xM+  1  <  k  (1  +  I  xal)  e_k/E. 


Finally,  using  (5.4)  ,  we  obtain  : 


Lemma  5.2  The  exists  k  s.t.  V  e  >  0 


E  I  xt+  -  "x*  I2  dt  <  ke  We 


From  Lemmas  5.1  and  5.2,  and  the  analogues  with  +  replaced  by  -  ,  we  deduce 


Lemma  5.3 

For  any  £0  >  0  ,  there  exists  k  s.t.  V  £  e  (0,Eq)  , 


+  ,2 


I  hs  -  H+  XST  r  ds  ;  C+(a,b) 


<  k  e 


-  k/V 


and 


l  hs  -  H  xs  r  ds  ;  C(a,b) 


<  k  e 


ky/l 


□ 


Theorem  5.4 

Veq  >  0,  3  k  >  0  s.t.  for  any  £  e  (0,  £q), 

P({L£<0}  nC+(a,b))  <  e_k/^  ' 
and  P((LE>0)nC(a,b))  <  e‘^ 


The  proof  of  the  theorem  relies  on  the  following  Lemma: 

Lemma  5.5 


Let  zt  =  H+xt+  -  H.xt';  3  a  >  0  s.t.  Veq  >  0,  3  k  s.t.  Ve  e  (0,  £q), 


£ 


2  ,  .  .  We 

zs  ds  <  a)  <  e 


e 


V-*- 


v' 


Proof  of  the  Lemma  (outline'* 
We  have: 


d  zt  =  F+ 


zt  dt  +  (F+  -  F  )  H  xt'  dt  + 


’  ht  -  H+  x,+ 

+  (  H+  K+  -  H  K  )  - dt  +  dv 

L  e  ! 


y; 


(  H+Ko 

d  zt  =  F+  -  -  z  dt  +  ( F+  -  F  )  H  x  dt  + 

1  £  J  r- 

h.  -  H  x ' 

+  ( H+  K+  -  H  K  )  - dt  +  dv 

L  e 


It  follows  from  the  variation  of  constants  formula  that  both  on  C+  (a,b)  and  on  C.  (a,b) , 
zt  is  the  sum  of  three  terms  zt  =  +  zt^)  +  zt^\  where  zt^)  is  of  order  Ve,  z»(^)  is  of  order  e 

and  the  third  one  is  exponentially  small.  The  first  term  is  the  crucial  one.  which  solves: 

dz/ 1  >  -  (F+  -  e' 1  H  K.)  zt< 1 )  dt  +  (H+K+  -  H.KJ  dvt 
with  initial  data  having  the  invariant  distribution.  By  introducing  a  new  time  t  such  that  E  x  = 
t  -  e,  the  required  estimate  reduces  to  a  large  deviations  estimate  for  the  ergodic  process  in  the  time 
scale  x.  • 

Proof  of  the  Theorem 

Let  us  prove  the  first  estimate  only  .We  now  rewrite  L  for  the  case  co  g  C+(a,b)  as  : 


L  =  — 
e  4e 


r  c 

“  1 H+  xs+  -  Hxs’l2ds  +  (H+  xs+  -  H  x  )d\£  + 

le 


+  T  IH+Xs+ 

4e 


-  2  1 
H  xs  rds  +  — 

e 


(  H+  xs+  -  H.  xs  )(  hs  -  H+  xs+  )  ds 


We  first  show  that  the  sum  of  the  last  two  terns  is  nonnegative  with  very  high  probability.  Indeed, 


UK  I 


.  - .  ■ ,  - .  * .  ■ .  s"  •/ •/  s-'-.-  .y-y./v-  ./ s,'v'-.'\‘"%"s^-.'  y /-S'" 


it  is  bounded  below  bv  : 


X  = 


8e 


H+  x/  -  H  xs  I2  ds  - 


2 

e 


I  h. 


H+xs+  l2  ds 


For  any  0  >  0  , 

P  ((  X<0  }  nCt(a,b)  )  <  P 

+  P 


f 

r 

, 

2 

£ 

^  1 

^  e 

Ih.  -  H  x„+  I2  ds  >  6 


S  +  S 


Pi  C+(a,b) 


(  -b 

1 

8e 

X  e 


I  H+  Xs+  -  H  Xs  I2  ds  <  0 


It  then  follows  from  Lemma  5.3  and  5.5,  provided  0  is  chosen  adequately  that: 

P({X  <  0}  n  C+)  <  ,  for  some  k  and  e  small  enough. 

ft 

Let  us  now  consider  the  first  part  of  L£.  Let  us  define  Mt  =  £'^2  eJ’  zg  dvs.  We  need  to 
estimate  the  quantity  P(  Mt  <  -  e'^2  <M>t ).  From  Lemma  5.5,  it  suffices  to  estimate  P(A),  where 

A  =  [  Mt  <  -e"1/2  <M>t }  n  {  <M>t  >  a  } 

Using  the  facts  that  E[exp(\  Mt  -  (X2/2)  <M>t)  ]  =  1  and  on  A,  if  X  <  0  : 

X  Mt  -  (X2/2)  <M>t  >  [-Xhlk  -  X2/2]  <M>t  >  [-XyV’e  -  X2/2]  a 
Now  chosing  X  adequately  we  have  that  for  any  k  >  0  and  £  small  enough, 

P(A)  <  e_k/^ 

The  proof  is  complete.  • 


Therefore,  knowing  that  we  are  on  C  ,  L£  is  a  good  test  statistics  to  decide  whether  we  are 
on  C+(a,b)  or  on  C.(a,b),  i.e.  essentially  whether  {xt>0,a<t<b}  or{xt<0;a<t<b}. 
Note  that  Lemma  5.1  proves  that  xt+(resp  x(‘ )  is  then  a  good  estimate  for  x,  ,  e  <  t  <  b. 


It  follows  moreover  from  the  above  that  the  variance  of  the  conditional  law  is  of  order  of  e  . 


6.  Summary  of  the  procedure  in  the  first  case,  and  the  general  case. 


Let  us  first  summarize  the  procedure  in  the  case  studied  so  far  of  two  intervals  with 


H^H  <0  . 

1-  At  each  time  k  e,  k  e  IN  ,  we  compute  y^,^  -  y  kE  ,  and  check  whether  or  not  its 
absolute  value  exceeds  a  given  quantity  c  . 

2-  As  soon  as  the  first  test  is  positive  over  a  certain  time-interval,  we  start  running  the  L£ 
-test,  possibly  in  a  sequential  way. 

3-  As  soon  as  we  have  an  answer  from  the  Latest,  we  follow  the  corresponding  Kalman 
filter  (one  might  continue  to  run  the  L£  -test,  in  order  to  correct  a  possible  wrong  decision). 

Note  that  before  we  get  any  answer  from  the  tests,  the  estimate  of  xt  is  zero.  During 
a  given  time  interval,  this  is  not  a  very  good  estimate.  But  that  situation  seems  to  be  inevitable. 
Indeed,  numerical  results  [3]  indicate  that,  just  after  xt  has  crossed  zero,  the  conditionnal  density 
has  two  peaks  on  both  sides  of  zero,  and  it  takes  some  time  before  one  of  the  peaks  disappears. 

The  reason  why  we  do  not  suggest  to  use  the  results  of  §4  to  build  a  test  for  the  choice 
between  {  xt  >  0}  and  {  xt  <  0}  is  that  a  test  based  on  the  approximation  of  the  quadratic 

variation  of  an  approximate  derivative  of  yt  would  not  be  very  robust.  Similarly  one  might  wish 

/• 

to  replace  the  test  based  on  the  values  of  y(k+1)E  -  y  kE  for  several  consecutive  k's  by  a  test 
using  the  outputs  of  the  two  Kalman  filters.  Indeed,  on  can  show  that  the  difference  h(xt)  -  H+  x(+ 
is  always  at  most  of  the  order  of  Ve  .  Unfortunately,  due  to  the  presence  of  the  local  time  term  in 
the  expression  for  h(x()  ,  we  were  not  able  to  get  a  good  enough  estimate  for  the  probability  of 
error  associated  to  such  a  test. 

Let  us  now  discuss  briefly  the  case  where  H+H  >  0  ,  and  the  general  situation.  In 
the  case  of  two  intervals,  iR  and  ,  with  H+H  >0,  h(x)  is  one  to  one,  and  clearly  no  test 

is  needed  to  decide  where  is  x, .  That  decision  is  in  that  case  obvious  fom  the  values  of  x,+  and 


7VW  *>..V.V  ">  W  W  ">  %“  v  v  -.'  r r.A-AA 


xt'.  One  might  also  in  this  case  invoque  the  result  of  Picard  [8]  . 

Finally,  in  the  general  situation,  we  have  to  detect  each  crossing  by  x(  of  local 
maxima  or  minima  of  the  function  h ,  and  choose  among  the  several  Kalman  filters  which  to 
follow.  One  can  either  construct  L£-type  tests  only  between  adjacent  intervals,  or  else  betwen  any 
pair  of  two  distinct  intervals,  depending  on  the  confidence  one  has  in  the  decisions  previously 
taken.  The  latter  obviously  depends  on  the  lengths  of  the  various  intervals,  as  well  as  the  difference 
between  the  values  of  adjacent  I  Hj  l's  . 

Let  us  finally  remark  that  for  the  case  of  two  intervals  1R_  and  !R+  ,  the  problem  can 
still  be  solved  if  H+  =  -  H_  ,  provided  F+  *  F  .  However  the  technique  is  different,  and  we  do 
not  develop  it  here. 
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